Возможно ли автоматизировать научное письмо?

Группа ученых физиков в Массачусетском технологическом институте (MIT, США) разработала нейронную сеть, форму искусственного интеллекта (ИИ), которая может создавать английские тексты (пока в ограниченной степени): она может читать научные статьи и создавать тексты.

Работой занимались: Румен Данговски и Ли Цзин, аспиранты MIT; Марин Солячич, профессор физики в Массачусетском технологическом институте; Преслав Наков, ведущий научный сотрудник Катарского вычислительного научно-исследовательского института, HBKU; и Михо Таталович, бывший научный сотрудник Knight Science Journalist из Массачусетского технологического института и бывший редактор журнала New Scientist .

Команда разработала альтернативную систему, которая вместо того, чтобы основываться на умножении матриц, как большинство обычных нейронных сетей, основана на векторах, вращающихся в многомерном пространстве. Ключевая концепция — это то, что они называют вращающейся единицей памяти (RUM).

По сути, система представляет каждое слово в тексте вектором в многомерном пространстве — линией определенной длины, указывающей в определенном направлении. Каждое последующее слово поворачивает этот вектор в каком-то направлении, представленном в теоретическом пространстве, которое в конечном итоге может иметь тысячи измерений. В конце процесса конечный вектор или набор векторов переводится обратно в соответствующую им строку слов.

«RUM помогает нейронным сетям очень хорошо делать две вещи», — говорит Наков. «Помогает им лучше помнить, и позволяет им более точно вспомнить информацию».

После разработки системы RUM для решения некоторых сложных физических проблем, таких как поведение света в сложных инженерных материалах, «мы поняли, что одним из мест, где мы думаем, что этот подход может быть полезен, будет обработка естественного научного языка», — говорит Солячич.