Разработчики рассказали, как ИИ написал "Тотальный диктант"
В начале апреля этого года ученый Новосибирского госуниверситета представил новую открытую систему искусственного интеллекта под названием "Писец".
Эта система, разработанная для выполнения различных задач, включая написание текстов, продемонстрировала впечатляющие результаты во время проведения "Тотального диктанта".
"Тотальный диктант", который состоялся 20 апреля и охватил 41 страну и почти 700 городов мира, был успешно выполнен системой "Писец". Этот проект стал первым опытом участия системы в масштабном мероприятии такого рода, и ее результаты превзошли ожидания даже самих разработчиков. Система "Писец" была создана научным сотрудником лаборатории прикладных цифровых технологий НГУ и сооснователем стартапа "Сибирские нейросети" Иваном Бондаренко. Ее успешное участие в "Тотальном диктанте" подтверждает потенциал и эффективность новейших технологий искусственного интеллекта в современном мире.На прошлой неделе в университете состоялся диктант на знание русского языка, и, казалось бы, все шло гладко, пока не пришло время проверять работы. "Писцу" вполне можно было бы поставить твердую "тройку", если бы не несколько обстоятельств. Из 276 слов диктанта он пропустил шесть, пять из которых стояли в конце предложения, причем в этих случаях он не ставил точку, но следующее предложение начинал с заглавной буквы. В одном месте пропустил предлог "в", шедший предпоследним в предложении. Еще семь слов им было услышано неверно", - рассказала старший преподаватель кафедры источниковедения литературы и древних языков Гуманитарного факультета НГУ Людмила Буднева.Ошибки в написании и понимании текста могут быть вызваны различными факторами, включая усталость, недостаток внимания или нехватку практики. Важно помнить, что владение языком требует постоянной тренировки и внимания к деталям.Анализ результатов диктанта позволяет выявить слабые места в знании языка у студентов и помочь им улучшить свои навыки письма и грамотности. Критическое осмысление ошибок способствует развитию языковых навыков и повышению качества письменной речи.Изначально разработанный год назад для автоматического стенографирования звукозаписей интервью или защит диссертаций, искусственный интеллект "Писец" продемонстрировал неожиданные результаты. В частности, вместо "наивысшего" он написал "наявившего", а вместо выражения "Читай — не хочу" - "Считай, не хотите". Также выявились проблемы в написании окончаний — "синями" (вместо "синими") и "портрет ... гимназисткЕ" (вместо "портрет … гимназистки"). Были обнаружены и другие ошибки.Эти результаты показали, что даже при 20-30% ошибок в расшифрованных текстах, "Писец" позволяет значительно ускорить процесс подготовки чистового текста стенограммы. Это означает, что человеку требуется гораздо меньше времени для завершения работы, чем если бы он писал стенограмму "с нуля", прослушивая запись полностью самостоятельно.Таким образом, использование искусственного интеллекта в подобных задачах не только увеличивает производительность, но и демонстрирует потенциал для дальнейшего совершенствования и развития в области автоматизации процессов работы с текстом.Исследование, проведенное Иваном Бондаренко, показало, что 20% ошибок в диктанте считается неприемлемым уровнем, эквивалентным оценке "двойка". Это свидетельствует о значительной сложности задачи распознавания речи для компьютерных систем.Кроме того, анализ результатов "Тотального диктанта" позволил выявить, что правильно распознанные слова оказывают значительное влияние на общую оценку качества диктанта. Таким образом, важно не только правильно расставить знаки препинания и разбить текст на абзацы, но и точно распознать все слова.
Для улучшения качества распознавания речи и развития искусственного интеллекта, разработчики сосредоточатся на создании более эффективных моделей среды, учитывающих особенности акустики и лингвистики. Это позволит улучшить точность распознавания и сделать системы распознавания речи более надежными и эффективными.
Источник и фото - ria.ru