Бюро оценки LABRATE.RU
©  Библиотека LABRATE.RU, 2018
Original article: http://www.labrate.ru/20181225/stenogramma.htm



к главной странице все материалы круглых столов ЦЭМИ РАН

Стенограмма круглого стола
"Определение ставки роялти с использованием больших данных и информационных технологий"

г.Москва, ЦЭМИ РАН, 25 декабря 2018 года, в 19-00
Нахимовский проспект, дом 47

[видеозапись] [аудиозапись] [фото] [презентация] [стенограмма] [А.Н.Козырев о Школе (видео)] [материалы по теме круглого стола] [онлайн регистрация] .


[#1] [#2] [#3] [#4] [#5] [#6] [#7] [#8] [#9] [#10] [#11] [#12] [#13] [#14] [#15] [#16] [#17] [#18] [#19] [#20] [#21] [#22] [#23] [#24] [#25] [#26] [#27] [#28] [#29] [#30] [#31] [#32] [#33] [#34] [#35] [#36] [#37] [#38] [#39] [#40] [#41] [#42] [#43] [#44] [#45] [#46] [#47] [#48] [#49] [#50] [#51] [#52] [#53] [#54] [#55] [#56] [#57] [#58] [#59] [#60] [#61] [#62] [#63] [#64] [#65] [#66] [#67] [#68] [#69] [#70] [#71] [#72] [#73] [#74] [#75] [#76] [#77] [#78]


Макаров Валерий Леонидович
Макаров Валерий Леонидович, академик Российской Академии Наук, председатель Научного совета по экономическим проблемам интеллектуальной собственности при Отделении Общественных Наук Российской академии наук



Козырев Анатолий Николаевич
Козырев Анатолий Николаевич, д.э.н., заместитель председателя Научного совета по экономическим проблемам интеллектуальной собственности при Отделении Общественных Наук Российской академии наук (ведущий круглого стола)



Костин Александр Валерьевич Костин Александр Валерьевич, к.э.н., ученый секретарь Научного совета по экономическим проблемам интеллектуальной собственности при Отделении Общественных Наук Российской академии наук

Ведущий: (Козырев Анатолий Николаевич, д.э.н., заместитель председателя Научного совета по экономическим проблемам интеллектуальной собственности при Отделении Общественных Наук Российской академии наук, главный редактор журнала "Цифровая экономика", автор первого в России учебника по оценке интеллектуальной собственности (1997)).
Мы начинаем последний в этом году круглый стол. Время конечно необычное, новогоднее, но нам случалось и 29-го проводить. В общем-то, Новый Год – он не такой уж и праздник, если разобраться, а работа – праздник для нас. У нас сегодня круглый стол более-менее рабочий, потому что расчет ставки роялти – это задача сугубо практическая. Здесь нет какой-то острой проблемы, столкновений интересов, но роялти определяют достаточно часто при заключении лицензионных договоров и всегда нужно на что-то опираться. Сегодня у нас есть почти научный доклад, который сделает Виталий Смирнов, он старался, он презентацию приготовил. Я говорю только вводные слова, тем не менее, я хочу сказать, что именно я имел в виду, когда предлагал тему «Расчет ставки роялти на основе больших данных».

Я исходил из той схемы расчета ставки роялти, которую в свое время придумал Гордон Смит, и которую я очень люблю. Схема такая. Считается доходность отрасли, определяется какую долю дохода занимает то, что можно отнести к усовершенствованиям, к технологиям, смотрится какие могут быть затраты. Затраты либо на покупку лицензии, чтобы быть на уровне с другими фирмами, либо на собственные разработки, что характерно для многих крупных фирм. Для мелких фирм, как правило, это покупка лицензии, ну и сколько это должно составлять в бюджете. Есть многолетние наблюдения, свидетельствующие о том, что действительно так получаются почти константы. Фирма либо работает на лицензиях, либо ведет свои НИОКР, но затраты на это взаимозаменяемы в каком-то смысле. Из этих соображений можно попытаться рассчитать какая должна быть ставка роялти для отрасли и даже для конкретной фирмы. Есть достаточно регулярная процедура.

Что меняется у нас с переходом к современным информационным технологиям? Меняется вот что. Появляется возможность пользоваться не просто статистическими данными, а большими массивами данных, собираемых аналитическими системами. У нас в России, например, есть система Спарк, которая позволяет делать очень большие выборки, причем самостоятельно формировать набор фирм, по которым мы делаем. Когда-то при расчете ставки роялти для Суперджета мы смотрели фирмы, которые похожи между собой, это бразильская фирма Эмбрайер (Embraer), потом мы смотрели канадскую фирму Бомбардье (Bombardier). Поскольку таких фирм мало смотрели и более крупные, Боинг, например, Аир бас, но это все равно очень мало примеров. Современная ситуация позволяет брать очень большие выборки. Для авиации может быть это не так характерно, но если мы возьмем какой-то более простой бизнес, то это могут быть тысячи фирм, может быть даже и десятки тысяч. Это руками уже не обработаешь, но современные средства позволяют это делать.

В общем-то, можно аналитически достаточно эффективно сформировать некую справедливую ставку роялти для отрасли, а дальше действовать по принципу, который тоже известен и был когда-то сформулирован "Перекрестком" – нашей известной сетью магазинов. А принцип такой. Свои магазины мы знаем, что на них происходит, знаем, какие должны быть затраты, какие должны быть доходы, и мы исходим из того, что другие, кто у нас на франшизе, должны работать примерно так же. Если у них получается лучше, они – молодцы, у них дополнительная прибыль, если у них получается хуже, чем у нас, они сами виноваты. Вот такой примерно принцип, вот это я имел ввиду. Тут есть, о чем поговорить, хотя все, по-моему, достаточно ясно, в деталях еще можно копаться. Виталий совершенно другую, по-моему, конструкцию нам представит, вот его и послушаем. Для этого надо выключить свет, я перейду на другую сторону, а он у нас продолжит.

Смирнов: Для начала представлюсь. Меня зовут Виталий Смирнов, учился и защищал кандидатскую диссертацию в МИФИ, и всю жизнь занимаюсь разработкой программ на всех стадиях жизненного цикла и разработкой интеллектуальных систем некоторых классов. В основном, все-таки, приходится заниматься обычными программами, потому что у нас как-то в стране разработка интеллектуальных систем, о которых расскажу, пока не сильно развивается, но, надеюсь, может быть, будет. Для начала еще раз основной термин, вокруг которого сегодня обсуждение - это Роялти, то есть вознаграждение за использование лицензии. Подробно на нем останавливаться не стоит, а вот стоит остановиться на схеме, представленной на этом слайде. Тут предлагаю вспомнить тем, у кого была информатика еще в школе или, может быть, в институте, а у кого-то не была, на самом деле, если посмотреть на выделенные черным процессы, точнее слева 4 процесса, то это те самые процессы, которые являются базовыми изучаемыми на уроках информатики. То есть всего четыре информационных процесса являются предметом информатики, это извлечение каких-то данных из каких-то источников, их представление в том или ином виде, затем хранение и обработка. Дальше хочу обратить внимание, что если посмотреть еще здесь на некоторые добавки, на результат, еще плюс если, вспомнить, что для всех этих процессов могут быть какие-то затраты, и все эти процессы связаны с какими-то рисками. Одновременно все эти 4 процесса могут сами давать те или иные результаты, касающиеся опять же чьих-то других результатов, рисков или затрат. В целом мы получим, собственно, такую довольно полную модель цифровой экономики. Очень трудно что-то еще придумать, что выходит за рамки такой схемы. В данном случае здесь фокус идет именно на оценочных процессах, и целью процессов является получение ставок роялти. Соответственно, источниками данных у нас являются некоторые источники оценочной информации, опять же носителями такой информации могут быть, о чем сегодня говорили, какие-то базы данных, а так же какие-то люди и документы, и без удобного представления этой информации, в частности для оценщиков, в виде каких-то документов, и лучше если это будут цифровые документы. Естественно, без хранения этой информации для многократного использования, а так же без обработки различными методами, которые либо сразу дают нам ставки роялти, либо за какое-то количество шагов позволяют прийти к этим самым ставкам, в данном случае не обойтись.

На всех стадиях мы, по существу, видим от извлечения до обработки постепенное приближение к тому, что мы в конце концов хотим получить, то есть к результатам этого всего. То есть либо мы ставку роялти включаем в какие-то лицензионные соглашения, либо это могут быть экспертные заключения, либо какие-то отчеты об оценках, но все это было бы хорошо, если бы все это всегда во всех случаях работало. К сожалению, как в жизни всегда бывает, есть какие-то технологические проблемы. Хочу еще уточнить здесь термин технологический, в данном случае я буду понимать под технологией две части - это методы, прежде всего те же самые методы извлечения, предоставления, хранения и обработки; и какие-то ресурсы, прежде всего информационные, для того, чтобы, собственно, все эти процессы могли осуществляться. О некоторых проблемах скажу, потому что понятно, что все проблемы очень долго и бесконечно можно обсуждать. Прежде те проблемы, с которыми в частности с Александром мы вместе сталкивались время от времени в тех его задачах, которые сейчас у него в рамках школы оценщиков. Прежде всего всегда возникает вопрос, хочется получить данные, а к ним по каким-то причинам затруднен доступ. Дальше методы извлечения данных, они имеют всегда какие-то ограничения, и, естественно, методы обработки так же уже частично связаны с первыми двумя проблемами, тоже оказывается имеет некоторые ограничения. Если говорить конкретно, если в качестве источников данных брать каких-то экспертов в предметной области, то может оказаться, что они просто нам недоступны, хотя, может, мы хотим применить так называемый "рейтинговый метод". Потом база данных может оказаться платной, опять здесь проблема. Это как то, что я говорил про затраты до этого. Получается, сначала надо заплатить, тогда мы можем уже как-то нормально работать. Не заплатили, ну, какие-то обходные пути или какие-то менее точные данные, может там Росстат или еще что-то использовать, например, так называемые "стандартные ставки роялти". Все это сразу снижает, в конечном счете. точность тех результатов, которые, в конце концов, попадают в отчеты и оценки экспертных заключений. Дальше, если Вы добрались уже до самих данных, может оказаться, что структура данных-то нам не очень подходит по отношении к тем методам, которые, например, конкретный оценщик привык использовать в своей работе. Понятно, что у разных оценщиков несколько разные методы, и они стараются, чтобы исходные данные подходили под то, что им, собственно говоря, нужно. Вот более подробно, допустим, если мы берем так называемый "рыночный метод", сравнительный, который позволяет нам сравнивать информацию о том объекте оценки, для которого, собственно, нужно получить результат, то есть, собственно, значение ставок роялти, с тем, что есть в каких-то базах данных, то, во-первых, может оказаться, что данные еще только в виде каких-то документов. Значит, их нужно сначала какими-то специальными методами структурировать и извлечь те самые свойства, которые нам нужны для сравнения этих документов, и сравнения с тем объектом оценки, который нас интересует. Дальше, допустим, то что уже частично я обозначил, если, все-таки, добрались до базы данных, там, все равно, есть какие-то атрибуты, но это не те, которые нас интересуют. Еще, могут быть еще более интересные проблемы, связанные с тем, что даже если атрибуты есть, но их домены, так называемые области определения, они несколько отличаются, то есть набор значений может быть совсем не тот, который нам хотелось бы иметь. Это, если обобщить, есть такая проблема даже в общении между людьми, так называемая "проблема общего кода", вроде говорим на одном языке, а все равно друг друга не понимаем.

И вот конкретные примеры, которые касаются классов МКТУ. Может оказаться, что в базе данных вроде есть такая классификация по товарным знакам, например, но это совершенно не российская классификация, а какая-нибудь американская. Тогда что делать? Надо как-то переводить одно в другое. Дальше вот что конкретно про ставки, вот есть база роялти, она тоже может быть разной, опять получается, как сравнивать? Надо приводить к одной и той же базе роялти, это совсем не очевидная задача. Значит нужно делать специально какую-то обработку, а что значит обработку? Может оказаться, что опять данных не хватает, значит надо из каких-то другие источников брать эту информацию. В итоге, что может здесь помочь? Некоторые современные технологии, такие как "Text Mining", если слышали, или, если не слышали, - это некий частный случай Дата Майнинга, который фокусируется на обработке текстовой информации. Конечно, может помочь онтологическое моделирование предметных областей и такое модное направление, как машинное обучение. Вот на данном слайде показана такая общая схема. Как она примерно может работать. Пусть у нас есть некоторые текстовые документы, это какие-то лицензионные соглашения, где могут содержаться в том числе и ставки роялти, которые в конце концов мы должны извлечь и, допустим, применить тот же самый "рыночный метод". Прежде чем работать с этим документом придется построить какой-то лингвистический процессор. Он может быть построен либо на статистических методах, либо на методах, основанных на семантическом анализе текста, есть два таких разных направления обработки текста. Для того, чтобы настраивать этот процессор нам уже может понадобиться онтологическое моделирование. Дальше, после того, как мы структурировали эту информацию, она только еще структурируется в терминах этого лингвистического процессора. То есть это некоторая внутренняя структура, есть какие-то слова, словосочетания, предложения. Если используется статистика, то там статистическая метрика. Если в основе лингвистической обработки семантический анализ текста, то там, соответственно, какие-то семантические категории к ней привязываются.

После этого возникает та самая задача получения значений атрибутов, и здесь либо руками, либо опять же на основе какой-то сложной онтологии придется эти атрибуты извлекать. Опять же, чтобы не заниматься полностью ручной работой, здесь как раз может помочь глубокое машинное обучение, которое на основе какой-то частной атрибутной модели может построить более общую, и тем самым мы получим те структуры, которые нам потом помогут уже заполнить базу данных непосредственно так, как нужно в соответствии, допустим, с заданной онтологии. Когда база данных заполнена, дальше уже понятно, что можно применять, допустим, рыночный метод. Если мы еще рассмотрим то, что касается некоторых значений, а эти значения, к примеру, связаны с базой ставки роялти, классификацией, все это приведем в нормальный вид, то тогда наконец-то мы придем к тому, что сможем эти ставки роялти нормально использовать. В качестве еще конкретно, такого примера, иллюстрирующего работу с онтологией, поскольку приближается Новый год, то удобно рассмотреть пример, связанный с винами, сидрами всякими. Вот в интернете была история с этикеткой Боско, кто-то скопировал, наклеил и продавал, потом судебные разбирательства длились не один год. Как оценить ущерб по этим винам? Нужно поискать какие-то документы, лицензионные соглашения, например, оценить, выявить суммы, близкие ли они к тем затратам или результатам от использования аналогичных каких-то товарных знаков, связанных, например, с шампанским. Здесь предложена такая многоуровневая онтология, которая позволяет дальше строить набор ключевых слов для того, чтоб уже в дальнейшем из баз данных извлекать информацию по разным винам и другим алкогольным напиткам. Здесь первый уровень вроде такой понятный, напитки, спиртные напитки, и это уже близко к той информации с ФИПС, которая есть по классам МКТУ, но когда мы будем искать базы данных, может оказаться, что там совсем другая и более подробная информация. Поэтому я в свое время отстроил такую пятиуровневую онтологию, то есть она частично, как видите, включает на втором уровне некоторые классы, некоторые термины, которые в классах МКТУ. Некоторые термины оказались уже на четвертом уровне. Как видите, в этой схеме на пятом уровне уже непосредственно понятия и соответственно ключевые слова, для которых, как выяснилось, все эти слова, которые справа, можно найти даже в интернете, и можно посмотреть прямо в интернете различные случаи использования тех или иных вин с наклейками Боско. Когда будет использоваться поиск, желательно, конечно, сначала искать по пятому уровню. Если здесь трудно что-то полезное найти, документы или какую-то другую информацию, значит придется подниматься на четвертый уровень, чтобы искать, а затем на третий по этой аналогии, потом на второй, ну и, в крайнем случае, на первый. Таким образом получается снизу вверх мы снижаем точность оценки, но зато получаем существенно большую выборку. И тут уже вопрос компромисса, то ли нужно пытаться какую-то частную информацию искать, то ли более общую, опять получается, оценщик должен сам решать, на каком уровне понятий он хочет строить свою оценку. Я думаю на сегодня хватит, спасибо за внимание. Какие есть вопросы?

Ведущий: (21:19) Начнем. Первый вопрос касается глубокого машинного обучения. В глубоком обучении нужно много данных, либо какая-то формализуемая ситуация, когда искусственный интеллект может сам с собой играть и совершенствоваться, но это – исключения. Откуда здесь много данных?

Смирнов:

Ведущий:

Смирнов:

Ведущий:

__________

Здесь будет размещена стенограмма и другие материалы круглого стола "Определение ставки роялти с использованием больших данных и информационных технологий"


Ссылка при цитировании:

Стенограмма круглого стола "Определение ставки роялти с использованием больших данных и информационных технологий" // Библиотека LABRATE.RU (Сетевой ресурс), 25.12.2018. - http://www.labrate.ru/20181225/stenogramma.htm



публикации по оценке интеллектуальной собственности


Материалы по теме круглого стола:

P.S. Обращаем Ваше внимание, что если Вы хотите оперативно и своевременно получать информацию о круглых столах в ЦЭМИ РАН и материалы Научного совета по экономическим проблемам интеллектуальной собственности при Отделении Общественных Наук Российской академии наук - подпишитесь на бесплатную рассылку:

https://ipcouncilras.timepad.ru/

Организаторы круглого стола
Онлайн Школа оценщиков интеллектуальной собственности [Платформа] [Группа в Facebook] [Курс для судебных экспертов]
Научный совет по экономическим проблемам интеллектуальной собственности при Отделении Общественных Наук Российской академии наук

Учреждение Российской академии наук  Центральный экономико-математический институт РАН (ЦЭМИ РАН)

Ведущий круглого стола - Козырев Анатолий Николаевич, д.э.н., заместитель председателя Научного совета по экономическим проблемам интеллектуальной собственности при Отделении Общественных Наук Российской академии наук, главный редактор журнала "Цифровая экономика", автор первого в РФ учебника по оценке интеллектуальной собственности (1997)

Козырев Анатолий Николаевич


Бюро расшифровок и переводов TEXT-PRO



реклама на LABRATE.RU        LABRATE.RU - советует





Стенограммы круглых столов ЦЭМИ РАН (2005-2018)




Союз образовательных сайтов Рейтинг@Mail.ru Rambler's Top100 Rambler's Top100 Яндекс цитирования Рассылка 'Научный Совет по экономике интеллектуальной собственности'


Библиотека LABRATE.RU. Правила копирования и цитирования материалов сайта, форума, электронных рассылок. Размещение кнопок и баннеров.