Интеллект государственной важности
– Развитие технологий искусственного интеллекта в современном мире становится определяющим фактором глобальной конкурентоспособности, технологического и национального суверенитета, – отметил модератор, сенатор Иван Евстифеев. – Очевидно, что дальнейшее внедрение систем искусственного интеллекта охватывает все сферы жизнедеятельности, и своевременное, сбалансированное правовое регулирование в этой области является одной из ключевых задач государственной политики Российской Федерации. Как подчеркнул в ходе своего выступления на конференции «Путешествие в мир искусственного интеллекта» Президент Российской Федерации Владимир Путин, критическую зависимость от чужих систем мы не можем допустить. Для России это вопрос государственного, технологического и ценностного суверенитета. Наша страна должна обладать целым комплексом собственных технологий и продуктов в области генеративного и искусственного интеллекта.
Мы продолжаем работу, начатую на нашем недавнем круглом столе, посвящённом цифровизации экономики без рисков мошенничества. Эту работу проводят и другие комитеты Совета Федерации, однако в целом Совет Федерации уделяет данному направлению приоритетное внимание. Тогда мы прямо говорили: одна из острых проблем – это законодательная нерегулируемость искусственного интеллекта. Мошенники уже активно используют дипфейки и иные технологии, тогда как чётких правовых рамок, позволяющих им противостоять на федеральном уровне, до сих пор не установлено.
Сегодня мы собрались, чтобы предметно обсудить, как данный пробел устранить. У нас уже есть Национальная стратегия развития искусственного интеллекта до 2030 года, Концепция регулирования ИИ и робототехники, экспериментально-правовые режимы в Москве и на транспорте. Однако до сих пор отсутствует единый системообразующий закон, определяющий права, обязанности и ответственность всех участников отношений в сфере искусственного интеллекта.
Текущая законодательная база имеет ряд системных пробелов, требующих скоординированной совместной работы. В целях их устранения Министерством цифрового развития, связи и массовых коммуникаций Российской Федерации разработан проект Федерального закона «Об основах государственного регулирования сфер применения технологий искусственного интеллекта в Российской Федерации». Данный документ направлен на защиту прав граждан и установление единых принципов работы с искусственным интеллектом. В настоящее время он проходит этап широкого общественного обсуждения, в ходе которого особую важность приобретает учёт предложений и замечаний участников ИИ-рынка. Многие из вас уже изучили вышеуказанный проект федерального закона. Это именно та правовая основа, которой нам так не хватало. Обращаю ваше внимание на принципиальные новеллы, предлагаемые данным законопроектом.
Чётко выделены субъекты: разработчики моделей, операторы систем, владельцы сервисов и пользователи. Для каждой категории прописаны конкретные обязанности: от документирования архитектуры ИИ до обязательного информирования человека о том, что он взаимодействует с машиной, а не с живым собеседником. Вводится обязательная маркировка синтезированного контента: аудио– и видеоматериалы, созданные искусственным интеллектом, должны содержать предупреждения, воспринимаемые как человеком, так и компьютерными системами. Это прямой ответ на угрозу дипфейков. Впервые на законодательном уровне предложен механизм разграничения ответственности за вред, причинённый применением искусственного интеллекта, соразмерно степени вины каждого субъекта. При этом, как справедливо отмечалось на профильных дискуссионных площадках, при введении правил необходим баланс, позволяющий не задушить развитие технологии и установить понятные для всех правила игры. Поэтому крайне значимо дальнейшее продолжение конструктивного диалога между разработчиками и регулятором. Критически важным представляется совершенствование механизмов правового регулирования оборота результатов интеллектуальной деятельности, созданных с помощью генеративных нейросетей, что продиктовано необходимостью защиты авторских прав и стимулирования инноваций.
Наконец, одним из наиболее сложных вопросов является разработка сбалансированной модели ответственности разработчиков, операторов, владельцев сервисов и пользователей за вред, причинённый с применением искусственного интеллекта, с учётом необходимости защиты прав граждан и недопущения избыточного давления на бизнес. Сегодня наша задача – детально проанализировать данный законопроект, проверить, действительно ли сформирован баланс между защитой данных и их использованием для машинного обучения, обеспечена ли прозрачность алгоритмов, а также каким образом делегируются юридически значимые решения системам искусственного интеллекта.
Рассчитываю на ваши профессиональные заключения и конструктивные предложения. Ключевыми целями сегодняшней встречи являются, во-первых, выработка консолидированной позиции по основным точкам законодательного регулирования искусственного интеллекта, а во-вторых, определение конкретных шагов и дорожной карты для гармонизации интересов государства, общества и участников ИИ-рынка на ближайшую перспективу. Мы должны выйти с данного совещания с консолидированной позицией, которая будет способствовать дальнейшему продвижению указанного законопроекта. Коллеги, в течение семи календарных дней мы будем принимать от вас возможные предложения, замечания, а также иные моменты, которые сегодня не будут озвучены. Всё это в нашем комитете совместно с коллегами будет проанализировано, и мы ждём от вас данную информацию в письменном виде для включения в итоговый протокол.
Шаткий баланс интересов
–Действительно, во исполнение поручений Президента и Правительства Российской Федерации Министерство цифрового развития, связи и массовых коммуникаций разработало проект федерального закона. Его цель – создание необходимых правовых условий для ускоренного развития технологий искусственного интеллекта в Российской Федерации, обеспечение технологической независимости, а также защита прав граждан и пользователей указанных технологий, – сообщил заместитель директора Департамента развития искусственного интеллекта и больших данных Минцифры России Аслан Габуев. – Законопроект обсуждался с экспертным сообществом и представителями бизнеса, а также был согласован с органами государственной власти. Мы тщательно проработали все полученные замечания, в том числе от согласующих структур, органов власти и бизнеса. Таким образом, все высказанные предложения мы постарались максимально учесть, сохранив баланс интересов.
На данный момент, по нашему мнению, закон регулирует основополагающие аспекты, необходимые для развития технологий. Как было отмечено, мы ставим целью установление рамочного регулирования с последующей тонкой донастройкой на уровне актов Правительства, отдельных ведомственных документов и положений, которые не могут быть урегулированы в рамках федерального закона. Это обусловлено тем, что данные положения, как ожидается, будут изменяться быстро и часто, а также носят технический характер. Следовательно, в рамках закона невозможно предусмотреть все детали. Таким образом, принятое регулирование является рамочным и базовым, создающим основу для дальнейшего развития на уровне правительственных и ведомственных актов. Мы постарались сохранить риск-ориентированную модель регулирования, однако реализовали её иначе, чем в некоторых иностранных юрисдикциях. Учтена отраслевая специфика: отраслевые регуляторы смогут предусматривать соответствующие риски и осуществлять регулирование, исходя из этих соображений.
– Мы понимаем, что экспертов в основном беспокоит вопрос разделения между суверенными национальными и доверенными моделями, – добавил Роман Кузнецов, директор правового департамента Минцифры России. – Мы готовы это обсуждать. Считаем, что водораздел между ними уже проведён. Также нам удалось решить вопросы, связанные с интеллектуальной собственностью и авторскими правами, исключив ряд спорных положений и урегулировав в целом вопрос ответственности. Изначально нормы были довольно жёсткими, однако сейчас мы их смягчили, доведя ответственность исключительно до несоблюдения требований конкретных норм данного закона, без каких-либо презумпций, которые предусматривались ранее.
Риски на осях
–«Ростелеком» – компания-вендор нейтральная. Мы не разрабатываем собственные большие фундаментальные модели, однако являемся крупнейшим интегратором в сфере внедрения информационных технологий и искусственного интеллекта в частности, – заявил директор по развитию цифровых технологий ПАО «Ростелеком» Роман Хазеев. – Мы должны уметь работать с любой моделью в соответствии с требованиями российского законодательства. Мы участвовали в обсуждении проекта законопроекта на площадках «Цифры» в аппарате Правительства и в АНО «Цифровая экономика». Много говорили о том, что существуют три нормы, непосредственно влияющие на нашу работу и на порядок внедрения решений по искусственному интеллекту: риск-ориентированный подход, распределение ответственности по цепочке участников оборота и признаки доверенности модели. Сегодня я хотел бы подробно остановиться на том, о чём мы знаем не понаслышке – а именно на подходе к оценке рисков при внедрении искусственного интеллекта. «Ростелеком» уже третий год активно внедряет решения на основе больших генеративных моделей в свою деятельность. Ежедневно 60 000 наших сотрудников используют такие решения. Внедряя новые инициативы, мы постоянно оцениваем их влияние на нашу инфраструктуру.
В отличие от классических информационных систем, риски, связанные с ИИ-решениями, носят динамический характер. Модель может вести себя иначе, чем на этапе внедрения: возникают дрейф данных, эмержентные свойства, и модель способна изменяться в процессе эксплуатации. Поэтому подход с точечной сертификацией не работает. Мы можем говорить только о целостном надзоре за процессом разработки и производства модели.
Это регламентируется новым ГОСТом, принятым 1 января 2025 года, который дублирует параметры ISO 42001. В целом эта проблема решается: речь идёт не о точечной сертификации, а о процессном подходе, когда сертифицируется весь цикл разработки и внедрения решений на основе искусственного интеллекта. Вторая особенность – зависимость от контекста: одно и то же ИИ-решение в разных доменах создаёт совершенно разный уровень риска. Например, биометрия для банковской идентификации и рекомендации в развлекательном сервисе «Винк» – это два разных риска, работающие в разных контекстах, хотя модель может быть одной и той же. Таким образом, одна и та же модель не может быть оценена одинаково вне зависимости от контекста.
Мы предлагаем решение, которое применяем в «Ростелекоме» – двухосевую классификацию. Первая ось – домен применения. Например, в корейском законопроекте учитываются высокорисковые зоны: здравоохранение, биометрия, найм, кредиты, государственные информационные системы. Вторая ось – системность модели: относительные критерии, такие как доля рынка, критичность инфраструктуры, широта развёртывания. На пересечении этих двух осей мы получаем понимание, какие нормы регулирования следует применять к той или иной модели.
Рассмотрим на практике. Чат-бот поддержки – низкий риск, локально развёрнутая модель, базовый режим, внедрение в короткие сроки. Биометрия абонента – высокий риск, также разворачивается локально, требует сертификации, человеческого пересмотра, внедрение занимает до девяти месяцев. Ещё более сложный случай – большие языковые модели, фундаментальные, используемые в государственных сервисах для миллионов граждан. Здесь требуется реестр моделей с разделением по уровню риска, прозрачность обучающих данных. Почему мы предлагаем разделять это на разные сектора и зоны? Потому что 80% решений в нашем портфеле, где «Ростелеком» внедряет ИИ, относятся к первому случаю и не требуют сложного регулирования. Оставшиеся 20% – это действительно серьёзные, тяжёлые подходы. Сейчас же все 100% моделей обрабатываются в режиме «как бы ничего не случилось», что задерживает разработку в полтора-два раза.
Внедрение гибкой классификации позволит регулятору сконцентрировать ресурсы и оценивать риски там, где это необходимо, а стартапам и малым компаниям – снять неопределённость. Сегодня неопределённость – главная причина, по которой многие проекты не запускаются вовсе. Говоря о нормах закона, действительно, это рамочный закон. Всё верно. Но мы очень опасаемся, что если в самом законопроекте изначально не определить нормы о риск-ориентированном подходе, мы получим правовую неопределённость для бизнеса: у нас не будет возможности инвестировать трёхлетние проекты, если правила могут меняться постановлением правительства. Без этой определённости планирование инвестиций превращается в азартную игру.
Второе – защита от ведомственного арбитража. Если требования устанавливаются разными ведомствами, мы оказываемся в текущей ситуации. У нас есть, например, пять заказчиков из разных федеральных органов исполнительной власти, которые выставляют разные требования к ИИ-моделям. «Ростелеком» как крупная компания это потянет – у нас сложный комплаенс, мы умеем к этому готовиться. Но малые компании, с которыми мы работаем, отсекаются от рынка, вынужденные подстраиваться под разрозненные стандарты. Единые стандарты упростили бы им вход в эти проекты.
Третье – конституционное основание: любые ограничения гражданских прав, согласно части третьей статьи 55 Конституции, могут вводиться только федеральным законом. Поэтому хотелось бы, чтобы прямая правовая позиция закреплялась именно в законопроекте. «Ростелеком» готов внести вклад в формулировку методик на площадке ТК-164, в рабочих группах при Минцифре и Совете Федерации. Мы готовы делиться практикой риск-менеджмента, накопленной у нас, опытом построения процесса управления, и предлагать конкретные нормы в законопроект.
Один из самых сложных
Законопроект об искусственном интеллекте – один из наиболее сложных регуляторных сюжетов, с которыми мы сталкивались за последнее время, возможно, за последние несколько лет, – считает директор по корпоративным отношениям ООО «Яндекс» Александр Дыханов. – Мы находимся в плотном диалоге с Минцифры, экспертным сообществом и другими компаниями. Со стороны Яндекса хотелось бы обозначить позицию по нескольким аспектам обсуждаемой повестки. Начну с разграничения категорий моделей. Это было первым пунктом в повестке: национальные, суверенные и доверенные модели. Мы поддерживаем подход, заложенный в законопроекте, – выделение национальных суверенных моделей является верным решением.
Обе категории отвечают стратегическим интересам государства и крупного бизнеса, и обе должны иметь возможность для развития. Исторически на рынке складывается разнообразие подходов, и именно это разнообразие создаёт устойчивость отрасли. Одни используют больше открытых решений, другие – меньше, третьи строят всё на открытом коде. Естественно, мы не должны на основании этого вводить жёсткие требования к одному из форматов и запрещать какие-либо модели. Это рискует создать искусственный дефицит и в целом замедлить внедрение искусственного интеллекта в экономику. Важный момент: в мировой практике значительная часть прорывных разработок в области ИИ строится именно на доработке решений с открытым исходным кодом. Мы поддерживаем подход, заложенный в законопроекте: базовые критерии отнесения моделей должны быть, они должны быть значимыми. Конкретные параметры следует устанавливать на уровне подзаконных актов – скорее всего, акта правительства или, по мере развития регулирования, отраслевых приказов министерств.
Что касается доверенных моделей, эта категория решает иную задачу. Она не касается способа или методологии производства модели, а относится к безопасности. Здесь есть важная деталь. Не буду повторять тезис коллеги из «Ростелекома», с которым полностью согласен. Эффективнее проверять не отдельную модель, а процессы и систему безопасности в компании в целом: наличие команды по безопасности, согласованную модель угроз, тестирование, управление рисками. Вижу в списке участников представителей B-индустрии, уверен, они подробнее расскажут об этом. Мы лишь отмечаем: аудит системы значительно надёжнее, масштабируемее и эффективнее, чем аудит каждой отдельной модели. Последний создаёт лишь излишнюю бюрократию и нагрузку на разработчиков.
Ещё один важный момент – требования к допуску. Они должны полностью соизмеряться с уровнем риска применения модели. Совершенно верно, что чат-бот в электронной коммерции, модель, принимающая решения в медицине, или система на крупном промышленном предприятии – это совершенно разные уровни риска, и регулирование обязано это учитывать. Универсальные требования ко всем моделям ведут к избыточной зарегулированности там, где она не нужна, и к недостаточности там, где она критична.
Второй важный сюжет – ответственность за вред от применения. Основной тезис: технология сама по себе нейтральна. Любая технология. Регулировать нужно не технологию, а её противоправное применение. Если человек использует искусственный интеллект для мошенничества, это мошенничество, и оно уже наказуемо. Если человек использует искусственный интеллект для распространения дезинформации, это распространение дезинформации. Введение специальных запретов на сам инструмент замедляет развитие отрасли и вовсе не решает проблему. Мошенник, которому скажут, что он не может использовать ИИ, продолжит его использовать. Этот подход соответствует мировой практике.
Из этого же тезиса вытекает прикладной вопрос, с которым мы как разработчики сталкиваемся ежедневно: маркировка контента. Мы не против маркировки, она реализуема, но скорее для определённых категорий контента – например, в политической коммуникации, острых социальных темах или медиа. Во всех остальных случаях маркировка должна быть скрытой, встроенной в метаданные файла, чтобы человек мог при желании проверить, сгенерирован контент или нет.
Примерно такой же подход мы обсуждаем с коллегами из министерства. Что важно учитывать: все эти требования не должны вводить чрезмерную нагрузку на отечественных разработчиков – на Яндекс, Сбер и другие компании, создающие модели. Они должны позволять конкурировать с иностранными игроками, которые продолжают присутствовать на российском рынке. Кто-то работает открыто, кто-то блокирует доступ для российских пользователей. Тем не менее они есть, и необходимо понимать: большинство, если не все, из этих разработчиков не будут соблюдать требования, вводимые законодательством, или будут соблюдать их так, как им удобно.
Запретить нельзя разрешить
Наше экспертное сообщество объединяет как крупнейших правообладателей в сфере интеллектуальных прав и информационных технологий, так и разработчиков моделей искусственного интеллекта. В этой связи мы считаем необходимым обратить внимание на проблему использования результатов интеллектуальной деятельности при обучении нейросетей, – заявляет директор Ассоциации предприятий компьютерных и информационных технологий Алина Комина. – Действующая редакция законопроекта допускает использование любых материалов без согласия правообладателей, при условии, что они получены правомерно либо доступны для анализа без ограничения техническими средствами. Такой подход открывает возможность создания программных продуктов и баз данных, которые минимально отличаются от оригиналов, обладая лишь косметическими изменениями. Подобные продукты выводятся на рынок в качестве дешёвых аналогов, что напрямую подрывает законное право правообладателей распоряжаться своими произведениями и извлекать из них экономическую выгоду. В конечном счёте это может привести к деградации целых сегментов рынка результатов интеллектуальной деятельности, включая IT-сектор. Мы убеждены, что правообладатели должны обладать полноценной возможностью запрещать использование своих произведений для обучения моделей искусственного интеллекта. При этом данное право не должно быть ограничено исключительно применением технических средств защиты; оно должно действовать вне зависимости от наличия или отсутствия таких средств. Полагаем, что разработчики моделей обязаны предпринимать разумные и достаточные меры для установления воли правообладателя – выяснять, установлен ли им соответствующий запрет. В свою очередь, необходимо определить унифицированный формат запрещающей отметки, пригодный как для автоматизированной обработки, так и для различных видов результатов интеллектуальной деятельности.
Это, по сути, ключевой аспект вопроса. Кроме того, хотим подчеркнуть, что способы свободного использования результатов интеллектуальной деятельности могут устанавливаться исключительно Гражданским кодексом Российской Федерации. Их введение в профильном федеральном законе напрямую противоречит положениям Гражданского кодекса, в частности статье 3 и статье 1229, которые определяют, что ограничения исключительных прав, включая способы свободного использования, должны закрепляться именно в Гражданском кодексе. Мы считаем, что Гражданский кодекс уже содержит эффективные и хорошо зарекомендовавшие себя механизмы балансировки интересов сторон. В их числе – трёхступенчатый тест на обоснованность ограничения интеллектуальных прав, а также принципы безопасной гавани, освобождающие информационных посредников от ответственности. Все эти механизмы могут быть применены и к отношениям, связанным с регулированием искусственного интеллекта. Поэтому мы безусловно согласны с необходимостью установления особых правил использования результатов интеллектуальной деятельности для обучения ИИ-моделей – это неизбежно. Однако призываем к тому, чтобы такое новое регулирование было органично встроено в Гражданский кодекс – как с точки зрения терминологии, так и с точки зрения уже устоявшихся и успешно применяемых подходов и критериев.
Безопасный кибермир
Два слова о том, как воспринимает данную деятельность индустрия информационной безопасности, – добавляет заместитель генерального директора проекта «Кибердом» Александра Шадюк. – Наша ключевая задача – думать о безопасности. Позвольте обозначить несколько тезисов. В первую очередь хотелось бы положительно отметить рамочный характер документа. Понимание того, что детальные нормы, особенно в области безопасности, будут прорабатываться через подзаконные акты, имеет критическое значение для столь динамичной и сложной сферы. Как уже отметили коллеги из «Яндекса», это верный подход.
Во-вторых, отрасль позитивно оценивает введение общих обязательств: документирование логики работы искусственного интеллекта, моделирование рисков, учёт инцидентов, назначение ответственных лиц. Всё это формирует минимально необходимую культуру безопасности. Крайне важно избежать ситуации, когда технологии развиваются, а о безопасности вспоминают в последнюю очередь. Безопасность, особенно в сфере искусственного интеллекта, должна быть краеугольным принципом. Безусловно, поддерживаю и идею локализации обработки данных для государственного сектора и объектов критической информационной инфраструктуры. В отдельных сценариях выделяется риск-ориентированный подход, о котором уже говорили. Я полностью присоединяюсь к тезисам, озвученным «Ростелекомом» и «Яндексом». Что хотелось бы отметить дополнительно?
Для отрасли крайне важно, когда регулирование в области безопасности передаётся в компетенцию таких инстанций, как СТЭК, ФСБ и другие. Очень хотелось бы, чтобы индустрия принимала участие в формировании подзаконных актов. Мы со своей стороны, как «Кибердом», уже прокладываем этот путь. Речь идёт, в частности, о пунктах третьей и пятой статьи восьмой. Здесь необходимо тщательно продумать, как именно будет обеспечиваться безопасность моделей. Каковы будут требования? Как уже отметили коллеги из «Ростелекома», основные опасения отрасли связаны с тем, что мы традиционно идём по пути сертификации, что в данном случае крайне неоднозначно. Модели и библиотеки обновляются очень часто – иногда несколько раз в месяц. Сертификация же может затягиваться на год. Текущие форматы, возможно, неприменимы. Здесь важно не следовать накатанной схеме, а рассматривать индивидуальные подходы.
Был затронут вопрос open-source моделей. Действительно, крайне важный. Приведу пример. Однажды я летела в Якутию, и в соседнем кресле оказались производители грузовых полувоенных беспилотников, направлявшиеся туда для продажи своей продукции. Я спросила: «На чём у вас управление?» Они ответили: «На китайском open-source». Это прямая иллюстрация необходимости риск-ориентированного подхода. Важно дать время. Уже озвучивала на нашем заседании, что мы поддерживаем возможность применения недавно внесённого Советом Федерации закона об экспериментальных правовых режимах в сфере цифровых технологий и инноваций. Нам кажется, что крайне важно обдумать соотношение применения экспериментальных режимов. Почему? С одной стороны, существуют серьёзные риски: иностранные, возможно, недружественных стран, open-source решения, на которых управляются военные беспилотники. Ни один ИБ-специалист не может гарантировать отсутствие закладок или определённых сценариев, при которых модель в определённый момент начнёт вести себя не так, как нужно. Эту проблему крайне сложно выявить. Риски велики. Но нам нужно дать время, поскольку на практике бизнес внедряет технологии, а регулирование приходит следом. Если мы жёстко запретим, как говорили коллеги, компании просто не успеют перестроиться.
Экспериментальные режимы позволят в областях, требующих перестройки, создать «песочницу»: понять, какие сроки необходимы, какие требования работают. Сроки вступления в силу многих требований, штрафов и жёстких мер возможно соотнести таким образом, чтобы сначала применить часть регулирования в экспериментальном режиме, убедиться в его эффективности, а затем запустить его в срок, определённый федеральным законом.
Отдельно хочу сказать: недавно в рамках конференции по искусственному интеллекту мы провели круглый стол, посвящённый дипфейкам, маркировке и технологиям контента. В нём участвовали представители Минцифры, Совета Федерации, Госдумы и технологические компании. Резюме встречи: важно дать технологиям время на развитие. На Западе венчурный бизнес в сфере маркировки и детектирования контента – это целая индустрия, в которую вкладываются огромные средства, и она быстро развивается. В России такого пока нет. Маркировку и модерацию контента прорабатывают только крупные технологические компании. На сегодняшний день ни СМИ, ни производители контента, ни блогеры к таким мерам не готовы. У них нет ни технологической базы, ни средств, ни экспертизы. Общедоступных технологий тоже нет. Социальные сети, которые могут подвергаться штрафам и контролю как поставщики контента, включая дипфейки, работают в режиме ежесекундной модерации.
В России сейчас нет технологий, способных за долю секунды отмодерировать контент и определить, является ли он искусственным (дипфейком) или натуральным. Также отсутствуют технологии, позволяющие судебной экспертизе со стопроцентной точностью установить, был ли это синтезированный контент или живой. Пока таких технологий нет, мы призываем к использованию экспериментальных режимов. Это позволит обкатать механизмы, дать возможность для инвестиций и создания «коридора» развития. Когда же мы получим стопроцентные гарантии с точки зрения технологий, экспертизы и судебной практики, тогда можно будет вводить ответственность и штрафы. Однако индустрию необходимо предупреждать заранее, чтобы никто не расслаблялся, а продолжал делать шаги для внедрения этих технологий.
И последнее. Крайне важно обратить внимание на безопасность на уровне страны и даже на уровне военной безопасности. Представьте: мы все понимаем, что в текущих условиях культура соблюдения персональных данных ранее не была на должном уровне. Сегодня практически о каждом человеке в интернете есть информация, произошло множество утечек, и все эти данные где-то хранятся. Модели искусственного интеллекта способны за доли секунды агрегировать эти массивы данных. Они могут стать доступны за рубежом, в том числе недружественным странам. Речь идёт о колоссальных объёмах данных о стране. Здесь важно не только защитить контур самих моделей, особенно больших глобальных, но и решить вопросы, аналогичные тем, что стоят в ИБ и средствах защиты информации: обеспечение процессоров и «железа». На форуме ЦИСО была информация, что в Америке и Китае существуют процессоры, позволяющие работать с терабайтами данных без выхода в интернет, используя модели искусственного интеллекта автономно. Потому что при выходе в интернет возможны утечки. В России таких процессоров нет; их предстоит создать. Использование больших генеративных моделей подразумевает не только саму технологию, но и инфраструктуру для сохранности данных, которые эти модели агрегируют.
Кто поёт с чужого голоса
Мы надеемся, что голос правообладателя будет услышан, потому что не всегда нас слышат и не всегда, к сожалению, привлекают к обсуждению, – заявляет Никита Данилов, генеральный директор Национальной Федерации музыкальной индустрии. – Для музыкальной индустрии использование генеративного контента сегодня является ключевой проблемой. По сути, в новом году мы проснулись в новой реальности: согласно нашим данным, 50% новых загрузок в стриминговых сервисах составляют полностью генеративный контент.
Более того, такой контент всё активнее пробивается в музыкальные чарты – порядка 20% представленной там музыки уже полностью синтезировано, начиная от треков в жанре СДП и заканчивая откровенно матерным контентом. Главная причина этого явления кроется в том, что генеративные модели обучаются на нашем контенте без нашего согласия. По общему правилу, любой контент, используемый внешними лицами, принадлежащий контент-правообладателям, подлежит обязательному лицензированию. Использование любых объектов авторских и смежных прав по общему правилу требует согласия на основании исключительной или неисключительной лицензии. Однако в редакции законопроекта этот принцип остаётся неучтённым. Устанавливается подход, допускающий использование объектов авторских и смежных прав для обучения систем искусственного интеллекта без согласия правообладателей. Это существенным образом ущемит права артистов, авторов, композиторов и лейблов.
Существует концепция развития креативных индустрий, предусматривающая достижение 6% валового внутреннего продукта за счёт креативных индустрий к 2030 году и занятость 15% креаторов в креативной экономике. Очевидно, что если мы потеряем значительную выручку из-за отсутствия лицензирования нашего контента на обучение и из-за замещения нашего контента синтезированным, то достижение таких целевых показателей станет невозможным. Поэтому наше предложение, которое мы поддерживаем вместе с Апкитом, заключается в закреплении в законопроекте прямого принципа: обучение систем искусственного интеллекта на объектах авторских и смежных прав является формой использования объектов интеллектуальной деятельности, и такая форма подлежит лицензированию.
В противном случае мы получим ситуацию, при которой российский контент и Российская Федерация станут инструментом для бесплатного обучения систем искусственного интеллекта – как российских, так и зарубежных. Это приведёт к замещению творческого контента: доля полностью синтезированного контента, созданного без души и не приносящего доход нашим авторам, артистам и композиторам, будет неуклонно расти. Это не проблема завтрашнего дня – это реальность сегодняшнего дня. Рынок музыкального стриминга, объём которого уже превышает 40 миллиардов рублей, неизбежно столкнётся со стагнацией. Непонятно, почему мы учитываем интересы компаний BigTech в ущерб огромной отрасли креативной экономики и интересам наших авторов. Более того, это прямой путь к монополизации рынка: компании BigTech одновременно владеют цифровыми сервисами дистрибуции контента. Они будут бесплатно обучаться на нашем контенте, бесплатно создавать новый генеративный контент, затем предоставлять его стриминговым сервисам и монетизировать через подписную модель. Это прямой путь к монополизации контентного рынка.
Часто приводят в пример международный опыт, ссылаясь на коллег из BigTech. Однако здесь происходит некоторое передёргивание: все юрисдикции – как дружественные, так и недружественные, за исключением, пожалуй, Японии, – идут по пути необходимости получения согласия правообладателей на обучение систем искусственного интеллекта. Это подтверждается законом Казахстана, статья 23 которого предусматривает право правообладателя запретить использование его контента для обучения, причём такое использование не приравнивается к формам образования и науки. То же самое касается Китая, где существует пакет мер по регулированию генеративного контента, обязывающий соблюдать права правообладателей и собирать их согласие. Аналогичные подходы действуют в Мексике и в законодательстве Европейского Союза, которое требует соблюдения прав правообладателей при обучении систем искусственного интеллекта и учёта произведений, использованных для обучения. Если разработчик ИИ использовал тот или иной контент, он обязан вести отчётность о том, какой именно контент был задействован. Полагаю, такой подход можно применить и в России, в том числе для выявления возможного противоправного контента, использованного при обучении.
Таким образом, мы, с одной стороны, обеспечиваем частноправовые интересы правообладателей, позволяя им видеть, на какой модели и на каком контенте обучалась система. С другой стороны, обеспечиваем публичные интересы, чтобы понять, что доверенные модели искусственного интеллекта не обучались, например, на экстремистском или ином противоправном контенте. Это вполне реализуемо, поскольку весь легальный контент в сети Интернет размечен: у музыкальных произведений есть уникальные идентификаторы ISRC. Разработчики систем искусственного интеллекта всегда знают, видят и понимают, на каком конкретном контенте они обучаются, поскольку этот контент идентифицирован и может быть учтён.
К сожалению, разработчики законопроекта на этапе его создания не привлекали именно правообладателей – владельцев авторских и смежных прав. Мы надеемся, что на этапе финальной доработки законопроекта мнение медийных индустрий будет учтено, и мы пойдём по пути охраны авторских и смежных прав. В противном случае мы встанем на путь новой формы цифрового пиратства. Государство долгие годы боролось с цифровым пиратством, принимая антипиратские законы и инициативы. Наше антипиратское законодательство является одним из лучших в мире. Однако сейчас мы движемся в обратном направлении: фактически предлагается отменить все ограничения, позволив бесплатно обучаться на чём угодно, создавать новый контент и монетизировать его.
Возникает вопрос: у нас в каталогах сотни тысяч единиц контента – как их всем промаркировать? Это колоссальные расходы для правообладателей. К тому же системы искусственного интеллекта уже обучились практически на всём существующем контенте. Получается, что нас, правообладателей, ещё обяжут маркировать наш контент за свой счёт. Речь идёт о миллиардах рублей: по нашим расчётам, одно технологическое решение для маркировки сотен тысяч единиц контента обойдётся в сумму порядка 100 миллионов рублей, и эту систему придётся постоянно совершенствовать. Таким образом, правообладателям предлагается за свой счёт маркировать сотни тысяч единиц контента, чтобы хоть как-то ограничить обучение.
Обратимся к судебной практике. Известные судебные дела зарубежных музыкальных правообладателей демонстрируют, что, когда правообладатели обращались в суд, обнаружив незаконное использование их контента для обучения, ответчики начинали заключать лицензионные соглашения и выплачивать роялти. Существует прямой механизм лицензирования, и экономические условия таких договоров вполне поддаются определению. Конечно, можно возразить, что в сети Интернет огромное количество единиц контента и собрать согласие на всё невозможно. Однако в России, например, в музыкальной сфере, крупнейшие правообладатели агрегируют до 80% единиц контента. Аналогичная ситуация, полагаю, наблюдается в книжной и киноиндустрии. Достаточно заключить несколько десятков договоров с крупнейшими правообладателями, и 80% каталога для обучения будет легально доступно.
Смотрим в книгу, видим ИИгу
– Мы также представляем интересы крупнейших правообладателей. Это действительно масштабная дискуссия, однако, на мой взгляд, уважаемые коллеги из Минцифры заняты подменой понятий, – добавляет Максим Рябых, представитель «Российского книжного союза». — Потому что в данный момент мы ведём речь не о заимствовании идей, безусловно, не так ли? Речь идёт о процессе до обучения и до генерации, то есть формирования неких смыслов, когда мы получаем новый генеративный контент, где действительно происходит взаимодействие со смыслами, а не с формой. Для начала формируются так называемые дата-сеты. Это массивы данных, которые беспрепятственно, либо с применением различных технических способов, сначала копируются на сервер. То есть мы говорим именно о форме. Копируются десятки, сотни тысяч единиц контента – музыкального, книжного. Затем этот контент размечается, то есть обогащается необходимыми метаданными: автор произведения, издательство, жанр и так далее. И только после того как этот контент по существу сохранён на сервере, мы говорим именно о воспроизведении, а воспроизведение – это способ использования, прямо предусмотренный Гражданским кодексом. В соответствии с ним правообладатель должен дать письменное согласие. Существует второй подход, с которым мы концептуально не согласны. Он предполагает, что должны быть технические средства, и именно они определяют способ регулирования этой деятельности. Однако в Гражданском кодексе прямо указано: отсутствие запрета со стороны правообладателя не является согласием. Это безусловное право, которое в настоящее время перекраивается. Мы говорим о том, что автор не должен разыскивать, в каких генеративных моделях и какой контент используется, особенно с учётом закрытости этих данных. На сегодняшний день нет ни одной нейронной сети, которая раскрыла бы свой дата-сет настолько, чтобы мы могли чётко определить, используется ли там наш контент. Более того, полагаю, большинство компаний будут этому препятствовать.
Именно поэтому мы настаиваем на том, что, в соответствии с позицией многих выступавших здесь коллег, необходимо осуществлять аудит самого процесса. Этот аудит должен обеспечивать прозрачность. Каждый правообладатель имеет право знать, что его контент используется и находится в дата-сете, на котором обучаются те или иные модели. Во-вторых, каждый правообладатель имеет право и должен иметь возможность изъять этот контент из оборота, если он не лицензируется. Этот подход необходимо учитывать.
Ещё один момент, на который я хотел бы обратить внимание, – это вопрос маркировки. Мы много говорили о маркировке, это очень дискуссионная тема. Коллеги из Министерства утверждают, что проводилась оценка регулирующего воздействия, и мы это, безусловно, оценивали. Однако я не услышал никаких цифр. Какие именно расходы понесёт индустрия в случае, например, маркировки лицензионного контента или генеративного контента? Я слышал, что в социальной сети «ВКонтакте» выступали представители и заявляли: для идентификации контента и определения, является ли он генеративным, необходимо потратить порядка 60 миллиардов рублей на разработку самой технологии. Эту оценку никто не проводил, хотя Министерство утверждает обратное. Каково соотношение роста экономики от генеративного контента? Не будет ли этот рост достигаться за счёт выпадения доходов? Не будет ли это фиктивным ростом, поскольку одновременно с увеличением оборота генеративного контента мы будем наблюдать падение оригинального? Оценка замещающего воздействия также не была произведена. Поэтому утверждать, что мы провели оценку регулирующего воздействия и это не отразится на сегментах экономики, на мой взгляд, неверно. По крайней мере, мы этого не слышали, и мы готовы включиться в эту проработку.
Мы видим, что чёткого взаимодействия с бизнесом нет. Сам законопроект несколько раз менялся. Понятно, что стоит цель, и по базовым принципам мы согласны: рамочный закон необходим, и нужно двигаться вперёд. Однако есть вещи, которые прямо противоречат Гражданскому кодексу. И есть вещи, которые необходимо каким-то образом решать иначе, внедряя поэтапно. В последней версии законопроекта, в статье тринадцатой, прямо говорится, что не является использованием искусственным интеллектом контента правообладателей, если этот процесс носит кратковременный характер. Это попытка использовать положения Гражданского кодекса о временном технологическом характере. Уважаемые коллеги, мы все прекрасно понимаем, что дата-сеты не носят временный характер. Дата-сеты переиспользуются, дообучаются, обогащаются данными. Нельзя посредством таких формулировок в законе об искусственном интеллекте фактически выводить использование из категории нелегального и из-под регулирования Гражданского кодекса. Мы как будто хотим разрешить конфликт, а в итоге его генерируем. Если эти нормы останутся в текущей редакции, это вступит в противоречие, и мы всё равно встретимся в судах. На мой взгляд, это неправильно. Либо мы признаём наличие проблемы и откладываем её на следующий этап, включая базовую формулировку, которая была в предыдущей версии законопроекта: что искусственный интеллект используется исключительно при соблюдении норм гражданского законодательства при взаимодействии с объектами интеллектуальной собственности. Эта рамочная норма остаётся, и мы остаёмся в рамках применения ГК.
Пока мы действительно не определим сферы, где это необходимо. Тормозить, условно говоря, проблемы безопасности страны, развитие науки, биологии, химии за счёт того, что мы пытаемся вкинуть развлекательный контент для дообучения большой языковой модели, неправильно. Мы, как правообладатели, своими интересами тормозим всех, но фактически становимся заложниками, потому что нам говорят: «Вы же будете тормозить всю экономику».
Новый труд и новый отдых
– Наш профсоюз объединяет работников платформенной экономики и платформенной занятости, – заявила председатель профсоюза «Новый Труд» Дарья Митина. – Поэтому совершенно очевидно, что в данном законопроекте и в рассматриваемой сфере нас интересуют не только технологические и маркетинговые аспекты, но и социальные – в первую очередь. Использование искусственного интеллекта высвобождает значительное число работников, с которыми придётся что-то делать. И думать об этом необходимо уже сегодня. Приведу пример из личной практики. Редакция интернет-издания, с которым сотрудничает наш профсоюз, насчитывала 70 сотрудников. После активного внедрения искусственного интеллекта осталось 38 штатных единиц. Люди ушли. Куда? Что с ними будет? Эти вопросы законопроектом не охвачены, но нам от них никуда не деться.
Смущает именно рамочный, общий характер документа. По системообразующим экономическим вопросам подобное изобилие декларативных актов – практика порочная. На этапе разработки принципиальнейшие вопросы нередко отдаются на откуп подзаконным актам, постановлениям и распоряжениям правительства, уходя всё ниже, а порой решаются в формате правового нигилизма – что мы неоднократно наблюдали в последнее время. Наша позиция такова: основная часть вопросов, связанных с искусственным интеллектом, уже урегулирована действующим законодательством. Мы против выделения ИИ в отдельную правовую систему и построения параллельной нормативной базы при наличии Гражданского кодекса, Федерального закона № 330 «О креативных индустриях», солидной базы по интеллектуальной собственности, авторским правам, правам потребителей. Плодотворнее было бы урегулировать точечные моменты, не охваченные существующими нормами.
Как справедливо отметили многие коллеги, даже беглый взгляд на законопроект без углублённой юридической экспертизы фиксирует его противоречия с Гражданским кодексом и иными действующими актами. Вопрос принципиальный: стоит ли включать искусственный интеллект в контур креативных индустрий? В нашем профсоюзе значительная часть членов – представители именно креативных отраслей. Обращаясь к международному опыту, напомню: экономист Эллан Фриман, разрабатывавший первую концепцию законодательства Британии о креативных индустриях, сформулировал главный критерий креативного труда – его незаменимость. То, что создаёт человек и что не может быть механизировано по определению. Смыслообразование всегда должно оставаться за человеком. Искусственный интеллект – это инструмент, расширяющий человеческие возможности, но ни в коем случае не подменяющий их.
Упомянутый Федеральный закон № 330 о креативных индустриях гласит: продукт, полностью сгенерированный ИИ, не может признаваться креативным. Однако данный законопроект предлагает иную трактовку – и мы уже фиксируем противоречие. Логично разделить правовые режимы: меры господдержки не должны распространяться на полностью сгенерированный контент. Иначе креативные люди будут не только конкурировать с машиной, но и проигрывать ей в этой конкуренции. Абсурдно, когда алгоритм получает государственные субсидии, тогда как миллионы создателей контента их лишены. Такая конкуренция заведомо неравна, и мы не должны её генерировать.
Ещё один важный момент. Статья 13 законопроекта предлагает охранять результаты, созданные ИИ, при условии их оригинальности. Это прямое нарушение статьи 1228 Гражданского кодекса. Творчество становится бесплатным ресурсом для алгоритмов – и это совершенно неприемлемо. Мы поддерживаем коллег, призывающих маркировать полностью сгенерированные продукты. В то же время приветствуем статью 9, пункты 2 и 3: безусловное право потребителя требовать замены услуг робота на человеческое участие. Это позитивный момент, который стоит сохранить. В нашей профсоюзной практике мы нередко сталкиваемся с блокировками счетов и карт граждан, носящими хаотичный и неосмысленный характер. Анализ показывает: в основной массе эти блокировки – результат работы алгоритмов, а не человеческого фактора. Путь восстановления прав тернист: алгоритм блокирует мгновенно, а доказывать свою правоту человеку приходится долго и трудно. Человек должен иметь право выбора – при выдаче элементарной справки можно обойтись автоматизацией, но в сложных вопросах он вправе общаться с человеком, а не с роботом.
Резюмируем: мы за правовое разделение по степени человеческого участия. Возможна градация: человек полностью создаёт продукт, использует ИИ частично или в значительной мере. Отдельно следует решить вопросы с генерациями, где человеческий вклад минимален. Сама формулировка технического задания – промпта – не должна автоматически признаваться достаточным основанием для авторства. Смешивать авторское право с патентным, для чего законопроект оставляет лазейки, неправильно. Творческий труд и научное изобретение – разные категории с особыми режимами регулирования, и во избежание путаницы это необходимо чётко прописать. Мы предлагаем уйти от декларативности, перейти к точечному регулированию и сделать так, чтобы не человек существовал для машин, а машины для человека.