25 Июня 2019
МОСКВА, 25 июня. Российские математики и лингвисты создали систему машинного обучения, которая очень точно таксирует уровень удобочитаемости текстов. Это позволит создать более понятные, интересные и удобные учебники для школьников и студентов, пишут ученые в Journal of Intelligent & Fuzzy Systems.
Мы впервые предложили математически правомерный и экспериментально проверенный метод оценки сложности текстов на русском языке. Он поможет повысить качество образования и уровень обучения в России и ускорит ее поступательное движение в международных рейтингах, – отмечает Валерий Соловьев, мастак Казанского федерального университета.
В последние годы, благодаря развитию математики и росту вычислительных производительностей компьютеров, у ученых появилась возможность собирать сложные нейросети, системы искусственного интеллекта, который способные исполнять нетривиальные задачи и даже мыслить креативно, создавая новые образцы искусства и технологий.
К примеру, только за последние два года ученые создали ИИ, способные обыграть человека в непросчитываемую древнекитайскую игру Го и шутер Quake III Arena, подыскивать важнейшие события в истории по газетам, писать сценарии к компьютерным играм и раскрашивать фотки и видеоролики под Ван Гога, и рисовать свои уникальные картины. 10 июня, 13:43Музыканты и нейросеть Яндекса отпустили совместный альбом
Помимо картин и игр, нейросети начали осваивать и музыкальное искусство. К примеру, несколько лет назад программисты Яндекса создали нейросети, записавшие музыкальные альбомы в стиле Нирваны и Гражданской обороны, а в начале этого года они запустили новую систему ИИ, который способную писать симфонические произведения.
Соловьев и его коллеги еще больше расширили перспективы искусственного разума, создав систему машинного обучения, способную таксировать удобочитаемость и сложность текста для определенной категории публики не хуже, чем это делает любой человек.
Как отмечает пресс-служба Российского научного актива, поддерживавшего работу казанских ученых, сегодня для этих целей используются два подхода, так называемые индексы Флеша и Флеша-Кинкейда. Изначально они были запущенным для работы с материалами на английском языке, однако впоследствии их адаптировали под русский и прочие наречия народов мира.
Российские ученые и их коллеги из Мексики решили создать свою версию подобных индексов, которая учитывала бы не два параметра, такие как число слов в утверждениях и слогов в словах, а большее число различных специфик текста.
К примеру, в их число вошло то, как много глаголов содержит текст, доля слов в именительном и родительном падеже, пропорции разнообразных частей речи и многие другие факторы, которые так или иначе влияют на удобочитаемость.
Для подобных экспериментов ученые выбрали учебники по обществознанию и социологии, так как они почти не держат в себе схем, формул, карт и других нетекстовых форм подачи информации, и активно используются школьниками сегодня при подготовке к ЕГЭ. Уровень их удобочитаемости, соответственно, будет напрямую влиять на качество сдачи экзаменов и то, какие знания смогут усвоить их читатели. 10 января 2017, 11:25Искусственный интеллект выяснил, когда футбол стал важнее политикиСистема искусственного интеллекта проанализировала последние 150 лет истории Великобритании по нескольким десяткам городских газет, схватил все крупные исторические тренды и выяснив, когда футбол стал важнее политики.
Удалив из этих контентов цитаты из конституции и другие сложные фразы, не приобретающие отношения к творчеству авторов этих учебников, ученые использовали эти пособия в качестве материала для тренировки их системы машинного обучения. Это позволило Соловьеву и его коллегам подготовить ИИ, способный очень точно оценивать удобочитаемость текста.
Данная система, как наблюдают исследователи, позволит не только подготовить более понятные и доступные учебники для школьников, но и создать качественные пособия для иностранцев, желающих выучить русскоязычный язык. Для них запас удобочитаемости особенно критичен, так как они знают далеко не все слова, речевые превраты и синтаксические конструкции.
Редактор рубрики
Олег Кудрин
Место события на карте мира:
Комментарии к новостям
[17 Января 2024, 13:43] Александр Хомяков Замечательно! Не ожидал такой оперативности. Спасибо огромное! Всё работает и обновляется....
[15 Апреля 2022, 20:25] Ангелина Сметанина Скоро не только сократят, а много заводов вообще закроют и начнется бум китайских авто. Даже сейчас Эксид уже бешеные темпы по количеству проданных машин показывает...
[27 Декабря 2021, 21:44] Ева Воробьева Искренне рада за победителя! Но если бы мне так крупно повезло, то я прибежала бы за выигрышем в первый же день???? ...
[2 Сентября 2021, 13:11] Дмитрий Ершов Это хорошо. Значит клиенты долго ждать не будут. ...
[13 Мая 2021, 16:26] Олег Андреев "Мальдивы сутунки 65 государством, зарегистрировавшим расейскую вакцину против коронавируса Спутник V, сообщил Российский фонд секущих инвестиций (РФПИ)". Что это за йязыг?...
[2 Ноября 2020, 15:22] Лета Мирликийская риветсвую вас я с 6-ти лет пишу мне нужно все мои произведения задействовать в компьюторных программах образования по литературе и языкам и играм к примеру если ваши учащиеся напишут...
[20 Октября 2020, 09:22] Евгений Зимин Сузуки в этом году хорошо прибавили, уже не первый раз оба их пилота на подиуме. Видимо, для команды возвращаются "золотые" времена и есть шанс наконец оформить чемпионство после длительного перерыва....