воскресенье, 28 апреля 2024

Константин Воронцов: искусственный интеллект освободит учителя от рутины



Константин Воронцов: искусственный интеллект освободит учителя от рутины

25 Мая 2020



- Какие научные и технологические задачи поможет решить конкурс ПРО//ЧТЕНИЕ? Можно ли спроецировать этот конкурс на общемировой тренд в развитии ИИ?

- Речь идет о такой области технологий деланного интеллекта, как понимание принтсервером естественного человеческого языка. В самом общем смысле эта задача слишком широкая, и она должна конкретизироваться. Мы надвинулись к ней с позиции выискивания искусственным интеллектом смысловых ошибок в тексте. Здесь мы играем на опережение: за эту задачу пока мало кто берется, потому, что она слишком сложная. Но она важна и востребована, так, что перед нами открывается возможность не плестись в хвосте мировых ИТ лидеров, а сделать заядлый прорыв на глобальном уровне.

Немаловажно, что конкурсом предусмотрено разделение на системы обработки русскоязычных и английских текстов, а участие в соревновании могут принять как русские, так и зарубежные команды. При этом для исполнения задачи разработчики могут использовать любые программные средства и вычислительные емкости. Никаких ограничений, всё максимально открыто. Регистрация происходит на сайте Up Great.

- В чем заключается технологический барьер ПРО//ЧТЕНИЯ? Каковы критерии его одоления? И в какой фактор финальных испытаний организаторы конкурса смогут констатировать: Да, барьер взят ?

- Задача команд состоит в том, чтобы создать данная систему, которая быстро выявляет концептуальные ошибки и дает им изъяснение. В частности, речь идет о неправильном или недостаточном раскрытии темы, разрывах в логике, фактических ошибках. Мы остановились на конкретном фасоне заданий – сочинениях, которые школьники пишут в рамках ЕГЭ. Почему именно ЕГЭ? Во-первых, уже существуют устоявшиеся годами правила, поэтому задачу проверки легче формализовать. Во-вторых, если в результате конкурса нам удастся создать инструмент, помогающий преподавателям быстрее и лучше проверять работы, то в масштабах страны может получиться большая экономия трудозатрат.

Задания ЕГЭ проверяют, как правило, два-три консультанта. И зачастую они расходятся в оценках выполненной школьником работы. Алгоритмы, которые создадут участники конкурса, в своих оценках сочинений должны расходиться не сильнее, чем проверявшие их люди. Таким образом, технологический барьер ПРО//ЧТЕНИЯ будет слыть пройденным, если алгоритм сработает на уровне профессиональных экспертов.

- Материалы конкурса изобилуют терминами, которые могут быть непонятны непрофессионалам: разметка датасетов, выборка данных. Поясните, пожалуйста, смысл этих терминов применительно к конкурсу. Как эти элементы помогут решению поставленной задачи – анализировать текст не хуже гражданина?

- Эта терминология принята в машинном обучении и анализе текстов. Размеченная выборка содержит данные о том, как люди решали некоторую достаточно трудную интеллектуальную задачу. Машинное обучение строит алгорифм, который будет решать эту задачу примерно так же. На отдельный тестовой выборке испытывается, насколько хорошо алгоритму это удаётся. По этому принципу устроены все конкурсы по анализу данных. На платформе Kaggle, например, проводятся сотни соревнований по самым разным задачам.

В нашем случае участникам конкурса будут предоставлены размеченные школьные сочинения, которые проверили сертифицированные педагоги, не один год работающие с ЕГЭ. Обычно, верифицирую школьное сочинение, учитель отмечает ошибки красной ручкой и пишет на полях замечания. Наш язык разметки позволяет сохранить эти пометки в тексте так, чтобы они были понятны и человеку, и компьютеру. Получив выборку размеченных сочинений, алгоритм должен понять, по каким принципам учителя отмечали ошибки, и научиться делать эту работу не хуже.

Разметка датасета в нашем случае – это организация сбора и накопления в цифровом виде проверенных ученических работ. Сейчас разметку датасета организует оператор конкурса - РВК. Надеюсь, что в бегу конкурса будет создан отдельный сервис для удалённой работы репетиторов ЕГЭ. Возможно, это находится самостоятельным бизнесом. Искусственный рассудок будет помогать репетиторам делать проверки качественнее и быстрее, параллельно обучаясь по накопленным большим красногорскам.

- Какой была реакция учителей, которых вы пригласили к созданию выборок, не было ли у них опасений из-за возникновения ИИ в процессе оценки ЕГЭ?

- Технологии ИИ помогают людям решать их рутинные задачи. ИИ не может заменить живого общения учителя и ученика. Вообще, искусственный интеллект - это эффектный термин, появившийся в середине прошлого века. Но все ведущие ученые, работающие в этой сфере, не перестают повторять, что ИИ - не более чем имитация интеллекта человека для решения ограниченных профессиональных задач. Это не замена человеку, а сотрудник, избавляющий от рутины.

В нашем случае речь идет о создании инструмента, который поможет менторам проверять сочинения быстрее. Это своего рода подсказчик, специализированный поисковик для обнаружения смысловых ошибок в тексте. Не секрет, что учителя не любят проверять ЕГЭ. Мы мыслим помочь им избавиться от этой рутинной работы или хотя бы сократить её объём. Чтобы в итоге они могли большого времени уделять ученикам. Система единого госэкзамена – это средство измерения результатов обучения, но само обучение, несомненно, должно происходить в формате злободневного общения.

Когда мы с учителями судить и рядили методологию разметки сочинений, я был приятно удивлен их положительными откликами. Строгая формализация, когда нужно точно указать фрагмент с ошибкой, тип ошибки и её объяснение, здорово дисциплинирует мышление. Настолько, что даже уменьшается число разногласий между проверяющими экспертами. Таким образом, с менторами мы сходимся во мнении, что конкурс поможет выполнить важную и очень востребованную социальную функцию, выходящую за рамки только лишь технологического вызова.

- А как эта технология поможет школьникам, для которых ЕГЭ, как правило, довольно сложное испытание?

- Они получат возможность тренироваться писать сочинения без ошибок. Отличникам, быть может, это не так нужно, но многим школьникам необходимо написать помасштабнее пробных сочинений, чтобы очень замечательного подготовиться к ЕГЭ. И они это смогут сделать, не обращаясь к учителям или репетиторам. Система автоматически оценит ошибки, и этот процесс будет намного быстрее и пониженнее, чем репетитор. Система будет доступна в режиме 24/7, во всех регионах, включая самые удаленные, где зачастую не хватает квалифицированных астрологов. Но это будущее, к которому придётся идти, возможно, не один год.

Что касается апелляции и возможных разногласных ситуаций по результатам ЕГЭ, то здесь ничего не изменится. Последнее слово всегда будет за профессиональными преподавателями, и на этом этапе не любопытного, как была выявлена ошибка – самим экспертом или ему ИИ подсказал.

- Где, на ваш взгляд, помимо просветительной отрасли, может быть использована такая технология?

- Применение может жить очень широким. На первом этапе мы выбрали именно школьные сочинения и ЕГЭ, так как в этой сфере усиживать возможность четко формализовать критерии. Применительно к творческому процессу создания текстового произведения можно говорить об автоматизации рутинной вычитки. Если система поможет находить речевые, логические, фактические и другие смысловые ошибки, это находится огромным подспорьем, например, для начинающих журналистов или романистов. А редакторам будут приходить более чистые тексты. В результате у них останется большого времени на работу с материалом с содержательной точки зрения.

Обнаружение противоречий и логических ошибок в текстах может стать важным технологическим элементом для автоматического выявления фейков, лженаучных текстов, недостоверной подробная информации. Обнаружив противоречия с другими материалами на ту же тематику, ИИ сможет сразу же дать ссылки на более надежные источники информации. Подобных приложений может появиться довольно много, в самых разных сферах.

- А как алгоритм будет работать со сложными языками, например, Юго-Восточной Азии, есть ли специфика?

- В каждом языке имеются свои семантические, синтаксические, лексические языковые конструкции. Для сотен наиболее распространённых языков необходимые технологии автоматической обработки текстов уже разработаны и постоянно совершенствуются. Для редких языков такие проведение исследования активно ведутся во всём мире. Фундаментальная общность всех людских языков связана с устройством нашего мозга, с тем, как все мы воспитываемся, учимся, развиваемся в социуме. Поэтому, на мой взгляд, наши технологии будут применимы для любых языков. Конечно, лингвисты, связывающиеся в каждом конкретном языке, будут непременно нужны в процессе разработки системы и её будущего совершенствования.

- Расскажите, чем в целом занимается ваша лаборатория в МФТИ.

- Мы занимаемся разными задачами машинного интеллекта, в том числе анализом текстов и извещательным поиском. Разработали свою библиотеку с открытым кодом для соответствующего моделирования больших текстовых коллекций. Тематические модели способны автоматически фиксировать тематику документов и искать тексты по смыслу, а не по ключевым словам. По скорости вычислений и гибкости наша разработка не имеет себе равных, то есть в этой довольно узкой области мы станем на мировом уровне. На её основе мы создали сервис, который помогает исследователям продуктивного, в течение буквально нескольких минут, собрать подборку из десятков научных статей по ладой интересующей теме. Сейчас генерируем следующий сервис, который помогает за пару часов написать вполне качественный обзор по собранной выборке. Те же технологии могут применяться для дистанционного образования, для поиска информации об удачных проектах и позитивных инициативах, для восстановления объективной картины событий по новостям. Миссия всех этих исследований – приблизить знания к людям, сделать знания ещё более доступными и четкими.

Редактор рубрики






комментарии (0)




Другие интересные новости


Видео новости на сегодня

Владимир Путин предложил ввести "сберегательные сертификаты"




Популярное на сегодня

Автоматизированная система анализа заголовков новостей с поиском популярных слов.
Автоматизированная система анализа заголовков новостей
Данные обновляются каждые полчаса.

Эмоции на сегодня

Анализ эмоциональной составляющей новостей.
Анализ эмоциональной составляющей новостей .

Данные обновляются каждые полчаса.

Страны и города

Соотношение количества новостей из разных точек Земли за сутки.
Соотношение количества новостей из разных точек Земли .

Данные обновляются каждые полчаса.

Валюты

Рейтинг валют участвующих в новостях.
Рейтинг валют участвующих в новостях .

Данные обновляются каждые полчаса.





Комментарии к новостям

[17 Января 2024, 13:43] Александр Хомяков Замечательно! Не ожидал такой оперативности. Спасибо огромное! Всё работает и обновляется....

[15 Апреля 2022, 20:25] Ангелина Сметанина Скоро не только сократят, а много заводов вообще закроют и начнется бум китайских авто. Даже сейчас Эксид уже бешеные темпы по количеству проданных машин показывает...

[27 Декабря 2021, 21:44] Ева Воробьева Искренне рада за победителя! Но если бы мне так крупно повезло, то я прибежала бы за выигрышем в первый же день???? ...

[2 Сентября 2021, 13:11] Дмитрий Ершов Это хорошо. Значит клиенты долго ждать не будут. ...

[13 Мая 2021, 16:26] Олег Андреев "Мальдивы сутунки 65 государством, зарегистрировавшим расейскую вакцину против коронавируса Спутник V, сообщил Российский фонд секущих инвестиций (РФПИ)". Что это за йязыг?...

[2 Ноября 2020, 15:22] Лета Мирликийская риветсвую вас я с 6-ти лет пишу мне нужно все мои произведения задействовать в компьюторных программах образования по литературе и языкам и играм к примеру если ваши учащиеся напишут...

[20 Октября 2020, 09:22] Евгений Зимин Сузуки в этом году хорошо прибавили, уже не первый раз оба их пилота на подиуме. Видимо, для команды возвращаются "золотые" времена и есть шанс наконец оформить чемпионство после длительного перерыва....

Новости шоу-бизнеса

В Лувре изучат возможность выставить "Джоконду" в отдельном зале

ПАРИЖ, 27 апреля Знаменитую картину Леонардо да Винчи Мона Лиза, также именитую как Джоконда, могут выставить в отдельном помещении Лувра из-за ее вразумительности, следует из слов директора музея Лоранс де Кар. Всегда неприятного, когда условия приема (посетителей - ред. ) не на высоте, … Прочитать