The 22nd International Conference SPECOM-2020 “Speech And Computerˮ
Table of contents
Share
QR
Metrics
The 22nd International Conference SPECOM-2020 “Speech And Computerˮ
Annotation
PII
S241377150014560-9-1
Publication type
Review
Status
Published
Authors
Alexey A. Karpov 
Affiliation:
St. Petersburg Institute for Informatics and Automation of the Russian Academy of Sciences (SPIIRAS)
ITMO University
Address: Russian Federation, St. Petersburg
Rodmonga Potapova
Affiliation: Moscow State Linguistic University
Address: Russian Federation
Vsevolod Potapov
Affiliation: Lomonosov Moscow State University
Address: Russian Federation
Pages
107-115
Abstract

  

Date of publication
24.06.2021
Number of purchasers
12
Views
978
Readers community rating
0.0 (0 votes)
Cite Download pdf 100 RUB / 1.0 SU

To download PDF you should sign in

Full text is available to subscribers only
Subscribe right now
Only article and additional services
Whole issue and additional services
All issues and additional services for 2021
1 7–9 октября 2020 г. состоялась 22-я Международная конференция “Речь и Компьютерˮ SPECOM-2020 (The 22nd International Conference on Speech and Computer, www.specom.nw.ru/2020 ), которая была впервые проведена как телеконференция в онлайн-формате на базе Санкт-Петербургского института информатики и автоматизации Российской академии наук (СПИИРАН), являющегося с 2020 г. обособленным структурным подразделением ФГБУН “Санкт-Петербургский Федеральный исследовательский центр Российской академии наукˮ (СПб ФИЦ РАН). Конференция, как всегда, проходила при поддержке Московского государственного лингвистического университета (МГЛУ).
2 Международная конференция “Речь и Компьютерˮ (“Speech and Computer”) проводится практически ежегодно, начиная с 1996 г. Первая конференция SPECOM была организована в Санкт-Петербурге 28–31 октября 1996 г. совместно д.т.н. Ю.А. Косаревым (СПИИРАН) и д.ф.н. Р.Г. Пиотровским (РГПУ им. Герцена) и проходила под общим председательством д.т.н., чл.корр. РАН Р.М. Юсупова (СПИИРАН). С тех пор она семь раз проводилась в Санкт-Петербурге и четыре раза в Москве, при этом с 1998 г. конференция организуется совместно СПИИРАН (СПб ФИЦ РАН) и МГЛУ. На территории России последний раз SPECOM проводилась под руководством МГЛУ в Казани в 2011 г., а в Санкт-Петербурге – в 2009 г. Все последние годы SPECOM была организована за рубежом (2013 г. – г. Пльзень, Чехия; 2014 г. – г. Нови Сад, Сербия; 2015 г. – г. Афины, Греция; 2016 г. – г. Будапешт, Венгрия; 2017 г. – г. Хатфилд, Великобритания; 2018 г. – г. Лейпциг, Германия и 2019 – г. Стамбул, Турция), став по-настоящему крупной международной конференцией, на которой освещаются ключевые междисциплинарные проблемы речевых технологий и исследований естественного языка и речи. Каждый год на конференции собираются сотни ведущих ученых со всего мира, включая специалистов в области компьютерных технологий, математических, прикладных и полевых лингвистических исследований. Всю эту информацию можно найти на интернет-сайте серии Международных конференций SPECOM – >>>>
3 С 2020 г. конференция SPECOM включена в Международный перечень топ-конференций в области информатики (Computer Science, >>>> ). В настоящее время SPECOM является первой и единственной Международной конференцией с российскими корнями, включенной в данный перечень топ-конференций, по результатам анализа 5-летней публикационной активности и цитируемости статей.
4 Организаторами 22-й Международной конференции “Речь и Компьютерˮ SPECOM-2020 традиционно выступили СПИИРАН (Санкт-Петербург) и МГЛУ (Москва). Генеральными председателями конференции SPECOM-2020 были д.т.н. А.А. Карпов и д.ф.н. Р.К. Потапова. Научное мероприятие было официально поддержано Международной ассоциацией по речевой коммуникации ISCA. Конференция проходила одновременно с 5-й Международной конференцией по интерактивной коллаборативной робототехнике ICR-2020, которая последние годы неизменно является сателлитным мероприятием в рамках SPECOM.
5 В 2020 г. SPECOM впервые была проведена полностью в онлайн формате с использованием интернет-сервиса Zoom и открытыми трансляциями в YouTube. Мероприятие собрало более 300 дистанционных участников, всего были представлены в форме интерактивных или видеопрезентаций 100 научных докладов на английском языке, выбранных по результатам строгого экспертного “слепогоˮ рецензирования из 160 поданных авторами из 20 стран мира полных статей (объемом от 8 до 12 стр.). Наибольшее число докладов было представлено авторами из России, Чехии, Германии, Франции и Турции.
6 Спонсорами конференции выступили корпорация Huawei (генеральный спонсор) и компания “АСМ Решенияˮ; конференция была поддержана также Международной ассоциацией по речевой коммуникации ISCA, Конгрессно-выставочным бюро при Правительстве Санкт-Петербурга и профессиональным организатором конференций “Мономаксˮ.
7 На конференции SPECOM/ICR-2020 были представлены три ключевых доклада, авторами которых являлись приглашенные ведущие специалисты из университетов и промышленных компаний.
8 Исабэль Транкосо (Isabel Trancoso, профессор Лиссабонского университета и института INESC-ID, Португалия, президент Международной ассоциации по речевой коммуникации ISCA) представила доклад на тему “Обработка речи для медицинских приложенийˮ (Profiling Speech for Clinical Applications). В своей лекции она осветила крайне актуальную в настоящее время тематику – комплексный анализ речи для задач клинической медицины, в том числе: автоматизированное выявление речевых и языковых нарушений у детей и взрослых людей, определение нейродегенеративных заболеваний диктора, детектирование респираторных заболеваний по голосу, анализ кашля и возможности детектирования вирусных инфекций (в том числе и COVID-19) по голосу и звуковым сигналам.
9 Ильшат Мамаев (Ilshat Mamaev, старший научный сотрудник Технологического института Карлсруэ, Германия) выступил с докладом на тему “Концепция пространства коллаборации человека и робота с использованием сенсоров близостиˮ (A Concept for a Human-Robot Collaboration Workspace using Proximity Sensors). В своей лекции он представил современные разработки в области человеко-машинных интерфейсов, включая взаимодействие человека-пользователя и роботов применительно к интерактивной коллаборативной робототехнике, в которой робот и человек совместно выполняют общие практические задачи для достижения общей цели.
10 Научные сотрудники китайской промышленной корпорации Huawei Алексей Петровский, Сергей Банкевич и Евгений Шуранов из Российского исследовательского центра Huawei (Москва и Санкт-Петербург) представили доклад на тему “Технологии Huawei для улучшения качества, обработки и синтеза речиˮ (Huaweiʼs Speech Enhancement, Processing and Synthesis Pipeline on Devices). В их совместном докладе были освещены современные достижения, разработки и технологии в области цифровой обработки аудиосигналов, автоматического распознавания и компьютерного синтеза речи по тексту, полученные Huawei, а также актуальные научно-технические проблемы и задачи, стоящие в настоящий момент в области речевых технологий.
11 Труды SPECOM-2020 были опубликованы до начала конференции издательством Springer Nature в серийном издании Lecture Notes in Computer Science (том 12335, >>>> ), которое индексируется Международными базами данных Scopus (входит в квартиль Q2) и Web of Science.
12 В ходе конференции проходили англоязычные устные сессии, включающие полные доклады (до 20 мин.) и короткие доклады (до 10 мин.), по следующим научным направлениям конференции:
13 1) Автоматическое распознавание речи (Automatic Speech Recognition) – представлены 6 полных докладов авторами из Германии, Чехии и России, в том числе СПИИРАН.
14 2) Голосовая биометрия (Voice Biometrics) – представлены 6 коротких докладов авторами из Чехии, Турции, Индии и России, в том числе СПИИРАН и МГЛУ.
15 3) Компьютерная паралингвистика (Computational Paralinguistics) – представлены 6 полных докладов авторами из Франции, Венгрии, Швеции, Турции и России, в том числе ИПУ РАН.
16 4) Обработка разговорного языка (Spoken Language Processing) – представлены 6 полных и 9 коротких докладов в двух секциях авторами из Франции, Германии, Великобритании, Дании, Чехии, Словакии и России, в том числе СПбГУ, РГПУ, СПИИРАН и др.
17 5) Цифровая обработка речи и аудиосигналов (Speech and Audio Signal Processing) – представлены 4 полных докладов авторами из США, Беларуси, Бангладеш и России, в том числе ИТМО.
18 6) Речевые и языковые ресурсы (Speech and Language Resources) – представлены 6 полных и 9 коротких докладов в двух секциях авторами из Болгарии, Нидерландов, Израиля, Чехии, Турции, Алжира и России, в том числе МГЛУ, МГУ, СПбГУ, КФУ и др.
19 7) Обработка естественного языка (Natural Language Processing) – представлены 6 полных и 7 коротких докладов в двух секциях авторами из Чехии, Великобритании, Узбекистана, Казахстана и России, в том числе МГЛУ, ИТМО, СПбГУ, ВШЭ, ФИЦ ИУ РАН, СПИИРАН и др.
20 Были представлены доклады, посвящённые междисциплинарным направлениям, объединяющим лингвистику, информатику, психологию, нейрофизиологию, в частности проблемам многоканального восприятия поликодового информационного контента, его воздействия на нервную систему человека в условиях современной интернет-коммуникации. Как отметили в своём сообщении исследователи из Тюменского государственного университета А. Черняев и др., за последние 15 лет Интернет стал одним из основных источников разноплановой информации для пользователей глобальной сети. Совсем недавно социальные сети и сетевые сервисы (Twitter, ВКонтакте, Facebook и др.), завоевавшие огромную популярность, повлияли на возникновение новых агрегатов и даже целой области в журналистике. В то же время, как показали междисциплинарные экспериментальные исследования коллектива под руководством Р.К. Потаповой при участии группы учёных из Института высшей нервной деятельности и нейрофизиологии РАН в рамках выполнения проекта РНФ 18-18-00477 (Р.К. Потапова, В.В. Потапов, Н.Н. Лебедева и др. “Влияние мультимодального поликодового интернет-контена на активность человеческого мозгаˮ – “The Influence of Multimodal Polycode Internet Content on Human Brain Activityˮ), способность человеческого мозга воспринимать, структурировать и перерабатывать информацию не безгранична и, более того, именно поликодовый характер этой информации в сочетании с разноканальным восприятием, характерным для современной информационной среды, фактически вплотную приблизил воздействие информационного потока к пределу выносливости нервной системы, что несёт непосредственную угрозу популяционному психофизиологическому благополучию пользователей информационно-коммуникационных технологий и в частности Интернета, которые на текущий момент составляют большинство населения, в силу чего валеологическая составляющая исследования коммуникации в наши дни выдвигается на первый план.
21 Доклад Р.К. Потаповой (Москва, МГЛУ) и В.В. Потапова (Москва, МГУ им. Ломоносова) Сравнительное исследование когнитивных и нейрофизиологических реакций на кодовые модификации Интернет-информацииˮ – “Some Comparative Cognitive and Neurophysiological Reactions to Code-Modified Internet Information.ˮ (исследование проводилось при поддержке РНФ, грант 18-18-00477) содержал абсолютно новый подход к анализу особенностей реакции пользователей Интернета на выявление семантического фокуса (ремы) поступающей монокодовой (аудиосигнала) и поликодовой информации Интернета. В докладе представлены результаты двух экспериментов:
22 а) соотносящихся с когнитивными аспектами ментальной обработки моно- и поликодовых стимулов Интернета;
23 б) нейрофизиологическими реакциями на те же стимулы, предъявляемые испытуемым.
24 Была сформулирована гипотеза, согласно которой основой для выявления гипотетической зависимости когнитивной реакции на реализацию семантического фокуса (ремы) и нейрофизиологического “откликаˮ на факт реакции испытуемого на обнаружение того же Интернет-стимула в предъявляемом моно- и поликодовом сигналах является разработка специального тестового опросника и применение полиграфического инструментария, фиксирующего нейрофизиологические реакции испытуемых в момент когнитивной фиксации семантического фокуса (ремы) на материале тестируемых моно- и поликодовых стимулов. Основой для тестирования послужили ad-hoc фразы, содержащие определенные виды тема-рематического членения и локализации семантического фокуса. В данном поисковом исследовании приняли участие 24 испытуемых одного возрастного ценза и обоего пола с одинаковыми временными показателями использования Интернета.
25 Результаты эксперимента, нацеленного на наличие сходств и различий в когнитивной оценке локализации семантического фокуса для двух видов моно-сигналов и одного вида полисигнала, показали особый сдвиг в когнитивной расшифровке для моноаудиостимула относительно максимального числа ошибочных оценок локализации семантического фокуса только на основе ориентации аудиостимула. Опора на тот же тестируемый материал применительно к эксперименту, проведенному с помощью применения всех возможностей полиграфа (например, физиологических показателей кожно-гальванической реакции, плетизмографиеских показателей, ЭКГ, регистрации дыхания грудного и диафрагмального типа, двигательной активности корпуса тела и др.), показала наличие корреляции между когнитивными и нейрофизиологическими реакциями на семантический фокус воспринимаемого стимула (в 70% показатели реакций совпадают). Данный вывод соотносится с видом предъявляемых стимулов, позволяющих в дальнейшем учесть влияние кодовой неоднородности стимулом на изменение семантической оценки воспринимаемого материала. Таким образом, прослеживается симультанность в реакции испытуемых на распознавание семантического фокуса моно- и поликодовых сигналов с охватом как ментально-когнитивных, так и нейрофизиологических параметров.
26 В докладе исследователей из СПбГУ Е. Разубаевой и А. Степихова (Истинно спонтанная vs ложно спонтанная речь: в поисках различийˮ – “Genuine Spontaneous vs Fake Spontaneous Speech: In Search of Distinctionˮ) освещалась актуальная в последние годы проблема: различие между истинной и имитированной спонтанной речью, что приобрело особое значение в связи с распространением дистанционной коммуникации, в том числе и в тех ситуациях, когда ранее это считалось невозможным (принятие важных решений с большой ценой риска и т.п.). Было показано, что, вопреки распространённому мнению, профессиональные навыки имитации речи, например, наличие актёрского и/или лингвистического образования, лишь немного увеличивают вероятность как успешного воспроизведения речевого контента, так и распознавания имитированной речи (отличения её от истинной спонтанной), что имеет существенное значение для экспертной криминалистической практики.
27 Такие явления, как хезитация, редукция, неполные формы произнесения, характерные для истинной спонтанной речи, были также подробно рассмотрены в сообщении М. Дайтер и Е. Риехакайнен (СПбГУ) “Автоматическое прогнозирование редукции словоформ в русской спонтанной речиˮ – “Automatic Prediction of Word Form Reduction in Russian Spontaneous Speechˮ. В данном докладе дается определение основных характеристик словоформ, которые подвергаются редукции в русской спонтанной речи с помощью алгоритмов машинного обучения. Рассматриваются факторы, предложенные в предыдущих корпусных исследованиях, а именно количество слогов, частота встречаемости слов, часть речи, редукция предыдущего слова. В качестве данных использовались тексты, взятые из Корпуса устной русской речи. Применены следующие машинные алгоритмы: сверхслучайное древо, алгоритм случайного леса и логическая регрессия. Результаты показывают, что чем выше встречаемость словоформы, тем выше шансы, что она будет редуцирована. Целью исследования было изучение гипотезы о лингвистических факторах, влияющих на редукцию словоформ русской спонтанной речи, с использованием машинных алгоритмов. Дальнейшие исследования в этой области могут включать в себя, помимо уже упомянутого тестирования обсуждаемых алгоритмов на больших базах данных, использование машины опорных векторов и перцептронных алгоритмов.
28 В докладе Чтение по губам с помощью LipsIDˮ – “Lipreading with LipsIDˮ (авторы: М. Хлавач, И. Грубер, М. Железны, и А. Карпов; Университет восточной Богемии, Пльзень, Чехия; NTIS, Пльзень, Чехия; Санкт-Петербургский институт информатики и автоматизации РАН SPIIRAS, Санкт-Петербург, Россия) представлен подход к адаптации существующих систем визуального распознавания речи. Методика адаптации основана на функциях LipsID. Эти особенности представляют собой обработанную область ROI губ. Признаки извлекаются в задаче классификации нейронной сетью, предварительно обученной на наборе данных, специфичном для системы чтения по губам, используемой для визуального распознавания речи. Процедура обучения для LipsID реализует потерю ArcFace для разделения разных говорящих в наборе данных и предоставления отличительных характеристик для каждого из них. Сеть использует сверхточные слои для извлечения функций из входных последовательностей изображений говорящих и предназначена для получения тех же входных данных, что и система чтения по губам.
29 Параллельная обработка входной последовательности сетью LipsID и сетью чтения по губам сопровождается комбинацией обоих наборов функций и окончательным распознаванием механизмом временной классификации Connectionist (CTC).
30 В этом докладе представлены результаты экспериментов с сетью LipNet путем повторной реализации системы и сравнения ее с функциями LipsID и без них. Результаты показывают многообещающий путь для будущих экспериментов и других систем. В процессе обучения и тестирования нейронных сетей, используемых в данной работе, применяются реализации Tensorflow.
31 В докладе Концептуальные операции с семантикой для робота-компаньонаˮ – “Conceptual Operations with Semantics for a Companion Robotˮ (А. Котов, Л. Зайдельман, А. Зинина и др.; Российский государственный гуманитарный университет, Москва, Россия; Национальный Исследовательский Центр “Курчатовский Институтˮ, Москва, Россия; Московский государственный технический университет им. Н. Э. Баумана, Москва, Россия) представлены особенности, важные для концептуальной обработки роботов-компаньонов. Предлагается практическая реализация когнитивной архитектуры, которая поддерживает эти функции при работе с настоящим роботом-компаньоном F-2. Робот разработан, чтобы реагировать на входящие речевые и визуальные события, направлять человека в проблемное пространство и накапливать знания из текстов и событий в памяти для дальнейшей поддержки диалога. Предлагается концептуальное представление, основанное на структурах лингвистической валентности (семантическое предсказание), которое подходит для связи компонентов обработки. Общая архитектура обработки основана на производственном подходе: она может запускать несколько сценариев и объединять речевые и поведенческие выходы этих сценариев на роботе. Система выполняет концептуальные операции с семантикой при обработке текстов на сервере в автономном режиме или при управлении роботом в режиме диалога, а также при помощи пользователю в решении головоломки Tangram.
32 В докладе “Задачи распределения в многоагентной роботизированной системе взаимодействия человекроботˮ – “Distributing Tasks in Multi-agent Robotic System for Human–Robot Interaction Applicationsˮ (Р. Галин, Р. Мещеряков, С. Камешева; Институт проблем управления РАН, Москва, Россия) указывется на то, что взаимодействие робот–человек становится актуальным трендом в робототехнике и наблюдается в различных ситуациях. Данная исследовательская работа описывает взаимодействие человека и коллаборативных роботов за пределами традиционных парадигм для роботов в общем рабочем пространстве. Это исследование показывает, что человек и роботы распределяют задачи в совместном взаимодействии многоагентной робототехнической системы. В рамках научно-исследовательской работы проанализированы различные методы распределения задач на глобальном и локальном уровнях в многоагентной робототехнической системе. Рассмотрены характеристики алгоритмов распределения задач. В качестве примера представлен роевой алгоритм частиц для распределения задач.
33 Перспектива исследования взаимодействия человека и робота заключается в получении синергетического эффекта от совместного процесса. Создание условий для взаимодействия человека и робота обеспечит эффективность и продуктивность технологических процессов за счет разделения задач и автоматизации операций. Роботы станут интерактивными и интеллектуальными, а люди будут адаптированы к жизни, в которой робот является неотъемлемой частью.
34 В докладе “Автоматизированное составление словаря корпусов текстов и вычисление степени конкретности русского языкаˮ – “Automated Compilation of a Corpus-Based Dictionary and Computing Concreteness Ratings of Russianˮ (В. Соловьев и В. Иванов; Казанский федеральный университет) представлен новый метод, реализованный авторами для создания словарей конкретных / абстрактных слов русского языка. Метод, основанный на предварительно подготовленных вложениях слов, вычисляет ранжирование конкретности, определяемое как функция сходства между векторами слов и расстоянием между рассматриваемым словом и “смысломˮ конкретных / абстрактных слов. Реализация метода повлекла за собой создание русского словаря конкретности / абстрактности с оценками конкретности. Контекстная информация, кодируемая вложениями слов, полезна для ранжирования слов по их конкретности. Полученные рейтинги C/A сильно коррелируют с оценками экспертов-людей.
35 Интерес к двойственному понятию конкретности / абстрактности, заметно возросший в последнее время, требует разработки таких инструментов, как специализированные словари для его изучения и использования. Создание словарей, содержащих для каждого слова индекс его конкретности / абстрактности, – очень трудоемкая задача. До недавнего времени таких словарей для русского языка не существовало. В статье описан подход, позволяющий быстро и автоматически создавать качественные словари конкретности / абстрактности. Словарь, созданный в этом способ для русского языка имеет коэффициент корреляции Спирмена со словарем, созданным вручную на основе опроса респондентов, равный 0,78.
36 В докладе Legal Tech: Метод валидации документов на основе ассоциативно-онтологического подходаˮ – “Legal Tech: Documents’ Validation Method Based on the Associative-Ontological Approachˮ (C. Кулешов, А. Зайцева и К. Ненаушников; Санкт-Петербург, Федеральный исследовательский центр РАН) указывается на то, что направление Legal Tech активно развивается, позволяя автоматизировать различные юридические задачи, решаемые как профессиональными юристами, так и рядовыми (обычными) пользователями. В связи с особенностями юридических документов в разработке Legal Tech широко используются технологии обработки естественного языка (NLP). Одной из задач в Legal Tech, решение которой необходимо как профессионалам, так и непрофессионалам, является валидация текстов документов, в том числе определенная проверка на наличие в них обязательных структурных элементов. В данной статье рассматривается реализация метода и алгоритма валидации, основанной на машинном обучении и использующей ассоциативно-онтологическое представление текста, документов под названием “Согласие на обработку персональных данныхˮ в русскоязычной юридической практике. Такая валидация происходит путем проверки документов через набор правил, при этом каждое правило описывает структурные элементы документов. Ассоциативно-онтологическое представление текста делает такие правила понятными для человека, упрощает их корректировку и доработку в соответствии с меняющимися нормами законодательства. Результаты экспериментальной верификации предложенного алгоритма на множестве текстов реальных правовых документов показывают его эффективность при применении в системах Legal Tech.
37 Юридическое сообщество в настоящее время не готово к внедрению автоматических моделей принятия решений и систем вывода для формирования законопроектов. Отсутствие развитых правовых систем использования роботов и сильное влияние этической составляющей в законотворчестве обусловили данную проблему.
38 Автоматизация должна быть подчинена рутинным задачам, стоящим перед юридическим сообществом: локальное корректирование на предмет ошибок и несоответствий в документах, поиск коллизий с законами или прецедентами, антикоррупционная экспертиза и др.
39 Многие этапы работы с документацией остаются прерогативой экспертного ручного труда, так как они требуют комплексного и творческого подхода, но некоторая рутина может быть автоматизирована.
40 Вместо узкоспециализированных решений был предложен подход, основанный на преобразовании опыта специалиста в систему логических правил. Разработаны принципы создания системы, выполняющей автоматическую валидацию юридических документов, в том числе метод и алгоритм валидации документов на основе правил. Сформирован набор документов для проверки работоспособности разработанных алгоритмов для каждого из обязательных и опциональных разделов, разработан прототип системы валидации документов, содержащих согласие на обработку персональных данных. Также сформирован набор автоматически генерируемых правил с помощью машинного обучения.
41 Экспериментальная верификация показала применимость ассоциативно-онтологического подхода к проблеме идентификации и валидации структурных элементов в юридических документах, содержащих согласие на обработку персональных данных. Наибольшая точность идентификации была получена на структурных элементах с меньшей изменчивостью текста и с конкретными терминами (например, в структурном элементе “Биометрические персональные данныеˮ). В некоторых структурных элементах, в связи с высокой изменчивостью текста в разных типах документов, потребовалась ручная корректировка созданных правил.
42 В докладе “Выявление слухов в российских твитахˮ – “A Rumor Detection in Russian Tweetsˮ (А. Черняев, А. Спрысков, А. Ивашко, Ю. Быдуля; Тюменский университет, Тюмень, Россия) исследуется проблема обнаружения слухов в российских твитах. Для проведения эксперимента была собрана база данных, представленная сообщениями в Twitter на русском языке. Было отобрано определенное количество характеристик данного явления, что послужило основой для обучения нейронной сети на материале примерно 3000 твитов, собранных и проаннотированных в процессе исследования. 40% образцов этой коллекции содержат в себе слухи о трех событиях. Для выявления слухов в твитах было разработано специальное программное обеспечение. Мы использовали SVM, чтобы отфильтровать твиты по типу речевого акта. Эксперимент был проведен, чтобы проверить твит на наличие в нем вымысла с учетом оценок точности, определенности и повторного вызова. Величина F1 достигла значения 0.91.
43 Для сбора и анализа данных использовалась программа Mozdeh, поддерживающая такие функции как поиск и получение данных о твитах, а также позволяющая анализировать текст и работать с различными языками, в том числе и с русским. Таким образом, база данных была сформирована благодаря использованию программы Mozdeh и официальной библиотеки Twitter. В ходе сбора данных было собрано и проаннотировано 3026 сообщений на русском языке, посвященных трем событиям, произошедшим в 2018 году. 1196 (40%) были достоверными, 1830 (60%) – нет. По результатам этого исследования было разработано программное обеспечение для выявления слухов в сообщениях русскоговорящего сегмента социальной сети Twitter. В исследуемой базе данных точность выявления отсутствия истинной информации, то есть непроверенного слуха определяется в рамках 92%.
44 Доклад “Оценка распределенных алгоритмов отказоустойчивого управления в группах роботовˮ – “Distributed Methods for Autonomous Robot Groups Fault-Tolerant Managementˮ (Э. Мельник, А. Клименко и И. Сафроненкова; Федеральный исследовательский центр Южного научного центра Российской академии наук, Ростов-на-Дону; Научно-исследовательский институт многопроцессорных вычислительных систем Южного федерального университета, Таганрог, Россия) посвящен проблеме отказоустойчивого управления в группах автономных и мобильных роботов. Эта проблема актуальна в связи с частым использованием групп роботов и отсутствием механизмов обнаружения ошибок отказоустойчивого робота и восстановления миссии. Были разработаны и представлены некоторые алгоритмы, основанные на протоколе репликации ViewStamped (с распределенным лидером) и на принципах консенсуса без лидера. Описана процедура анализа контекстной информации и конкретная процедура избрания лидера. Кроме того, разработаны алгоритмы без лидера с учетом динамического расположения групп роботов. Разработаны модели оценки эффективности алгоритмов с точки зрения коммуникационных накладных расходов и приведены отдельные результаты моделирования.
45 В настоящем докладе были представлены и приблизительно оценены два алгоритма: алгоритм диспетчеризации системы с распределенным лидером и алгоритм без лидера. Эти алгоритмы были разработаны на основе хорошо известного протокола репликации ViewStamped Replication и на основе метода консенсуса без лидера. Тем не менее, были внесены некоторые изменения: исходные алгоритмы не предполагают перемещения групп узлов. Решить эту проблему можно за счет использования контекстного хранилища данных (включая генеральные планы миссий, текущие координаты роботов и т.д.). Необходимость передачи контекстных данных увеличивает нагрузку на сеть, но обеспечивает основу для отказоустойчивости.
46 Оценки эффективности разработанных алгоритмов позволяют сделать следующие важные выводы:
47 • распределенный лидер эффективен в группах роботов с относительно короткой миссией (небольшой размер контекстного хранилища данных);
48 • распределенный лидер эффективен в группах с надежными устройствами, так как восстановление в случае отказа лидера требует значительных временных и сетевых ресурсов;
49 • безлидерное управление эффективно в условиях длительных по времени миссий и относительно небольшого количества роботов в группе.
50 Впервые в формате SPECOM обсуждалась проблема, связанная с одним из способов хранения информации с помощью метода стеганографии (Р.К. Потапова, А.В. Джунковский, МГЛУ, Москва). В докладе “Предварительное исследование потенциального размещения стеганографического контейнераˮ – “Preliminary Investigation of Potential Steganographic Container Localizationˮ предложен новый оригинальный способ хранения информации, затрудняющий процесс поиска и обнаружения информации. Основным объектом служит специальный текст на материале русского языка, содержащий все разновидности и варианты единиц поуровневого характера: от фонетического до синтактико-семантического. Проведенные эксперименты на статистически достоверном материале показали, что варьирование поуровневой специфики связного текста разнообразными “пограничными сигналамиˮ (по Н.С. Трубецкому и Р.К. Потаповой) дает возможность использовать особенности восприятия этой информации для решения задач стеганографии.
51 В докладе Токсичность в текстах и изображенияхˮ – “Toxicity in Texts and Images on the Internetˮ (Д. Гордеев, Москва, МГЛУ, и В.В. Потапов, МГУ им. Ломоносова, Москва) отражены результаты исследования, цель которого заключалась в разработке специального программного способа установления наличия-отсутствия фактора токсичности на материале текстов и изображений. Сформированная для этого база данных включала 8800 единиц иллюстративного Интернет-материала текстового и изобразительного характера, то есть включающего только краткий текст, только изображение (картинку) и совместную комбинацию вышеуказанных типов стимулов. Основой для решения задачи послужили результаты ручной классификации единиц Интернет-мемов, целью которой являлась ориентация на признаки “наличие токсичностиˮ – “отсутствие токсичностиˮ. При этом ставилась дополнительная задача: при классификации на восприятие определить не только “наличие токсичностиˮ – “отсутствие токсичностиˮ, но и с опорой на признаки, позволяющие провести это различение, то есть с опорой либо на краткий текст, либо на изображение. Полученные при предварительном эксперименте данные позволили использовать их в процессе обучения нейронных сетей. Таким образом, как показал данный подход, возможно на большей статистике уточнить дифференциальные признаки оценки Интернет-материалов на “токсичность – нетоксичностьˮ и с использованием более точных признаков а) кратких текстов, б) изображений, в) кратких текстов с вспомогательными изображениями, продолжив разработку программного способа автоматизированного решения задачи идентификации токсичности в Интернет-коммуникации.
52 Следующую 23-ю международную конференцию “Речь и Компьютерˮ SPECOM-2021, приуроченную к 25-летию основания конференции, решено провести в Санкт-Петербурге на базе СПб ФИЦ РАН и при непосредственном участии МГЛУ в организации конференции 27–30 сентября 2021 г., по возможности в гибридном формате: www.specom.nw.ru/2021

Comments

No posts found

Write a review
Translate