Компьютерная лингвистика вшэ: Магистерская программа «Компьютерная лингвистика» — Национальный исследовательский университет «Высшая школа экономики»

Содержание

Траектории поступления — Магистерская программа «Компьютерная лингвистика» — Национальный исследовательский университет «Высшая школа экономики»

Правила приема в магистратуру НИУ ВШЭ в 2021 г.здесь.На программу можно поступить тремя способами: успешно пройти конкурс портфолио, победить на Олимпиаде или (только для иностранных студентов) получить квотное место.

1. Вступительные испытания

Для поступления в магистратуру необходимо: Пройти конкурсный отбор по портфолио. Критерии оценивания портфолио приведены ниже. Абитуриенты, набравшие необходимое количество баллов, приглашаются на собеседование, которое может быть проведено очно или по скайпу.
Состав портфолио, представляемый на конкурс, должен включать в себя следующие позиции:

1) Резюме

Резюме представляет собой структурированный список достижений абитуриента. Комментарии к позициям списка приветствуются. Примерная структура списка представлена ниже.

Образование:
  • дополнительное
  • стажировки
  • курсы
  • онлайн курсы

Указывайте максимально полно каждую позицию, включая даты начала и конца обучения.

При необходимости (например, вы недоучились, пропустили год и т.д.) снабдите позицию необходимыми комментариями.

Академическая деятельность:
  • краткое описание научных интересов
  • тема диплома с краткой аннотацией (материал, результат)
  • список выступлений на научных конференциях (название выступлений, название конференции, дата и место проведения)
  • список публикаций (выходные данные публикации, аннотация публикации)
  • участие в грантовых проектах (название проекта, название института, на базе которого реализуется проект, ФИО и должность руководителя проекта, цели проекта, роль в проекте) участие в научных экспедициях ( место, дата проведения экспедиции, тема исследования)
Проектная и практическая деятельность:
  • опыт работы
  • опыт преподавания или ассистентства
  • опыт волонтерского участия в академических/университетских мероприятиях (организация конференций, проведения дня открытых дверей, лекции школьникам и т.д.)
  • опыт волонтерского участия в научно — популярных проектах
    Каждую позицию снабдите точными данными ( время, место, название, если есть) и аннотациями, раскрывающими суть вашей деятельности.
Награды и достижения:
  • стипендии
  • победы в конкурсах в вузах (лучший доклад, лучшее исследование и т.д.)
  • другие награды, связанные с академической, образовательной, учебной или проектной деятельностью
2) Мотивационное письмо

В мотивационном письме должны быть даны ответы на следующие вопросы:

  • Почему вы выбрали данную магистерскую программу?
  • Что в вашем базовом образовании вы считаете наиболее полезным для дальнейшей деятельности (курсы, практики, навыки, умения, знания)?
  • Что вы ожидаете от обучения в магистратуре? Какие курсы вас особенно привлекают? Предложите проект, который хотелось бы реализовать
  • Чем бы хотели заниматься после магистратуры?
3) Документальные подтверждения позиций резюме

Документально должны быть подтверждены все позиции образования (диплом о базовом образовании, сертификаты допобразования, курсов и онлайн курсов) и все позиции наград и достижений. Прочие документы предоставляются по желанию абитуриента.

Критерии оценки портфолио (PDF, 319 Кб)

2. Поступление по олимпиаде

Правом на поступление без вступительных испытаний обладают победители Олимпиады НИУ ВШЭ для студентов и выпускников «Высшая лига», направление «Фундаментальная и прикладная лингвистика». Для участия в Олимпиаде необходимо предварительно зарегистрироваться на сайтеОлимпиады.

3. Иностранным абитуриентам

Обучение для иностранных магистрантов, поступивших на магистерскую программу в рамках квотного набора, бесплатно (финансируется программой правительства РФ). Обратите внимание: программа действует не только для граждан СНГ и стран Балтии, но также для граждан любых других государств. Ознакомиться с условиями участия в программе и необходимыми формальными процедурами, а также заполнить анкету для участия в программе, можно здесь.

Подготовка — Магистерская программа «Компьютерная лингвистика» — Национальный исследовательский университет «Высшая школа экономики»

В случае возникновения технических проблем при подаче документов через личный кабинет просьба направлять скриншоты на адрес [email protected]

Для поступления в магистратуру необходимо пройти конкурсный отбор по портфолио. Процедура оценки портфолио включает в себя собеседование, которое может быть проведено очно или по скайпу.     

Рекомендованная литература
·    Daniel Jurafsky & James H. Martin. Speech and Language Processing: An introduction to natural language processing, computational linguistics, and speech recognition. Third Edition. https://web.stanford.edu/~jurafsky/slp3/

·    Николаев И.С., Митренина О.В., Ландо Т.М. (ред.) Прикладная и компьютерная лингвистика. Изд 2. URSS. 2017. 320 с.

·    Cборники конференций COLING, ACL, EACL, LREC, EMNLP, NAACL, «Диалог» (http://www.dialog-21.ru/) последних лет ·    Steven Bird, Ewan Klein, Edward Loper. Natural Language Processing with Python. – Analyzing Text with the Natural Language Toolkit. https://www.nltk.org/book/

·    Christopher D. Manning & Hinrich Schütze. Foundations of Statistical Natural Language Processing. MIT Press, 1999.

·    Yoav Goldberg. Neural Network Methods for Natural Language Processing (Synthesis Lectures on Human Language Technologies). Edited by Graeme Hirst. Morgan & Claypool 2017

 

Цель и основные задачи вступительного испытания

Цель вступительного испытания – определить готовность и мотивацию абитурента, поступающего в магистратуру освоить выбранную программу магистратуры, определить у поступающих базовый уровень подготовки в области компьютерной лингвистики.

Основные задачи вступительных испытаний:

– проверить уровень знаний претендента;

– определить склонность к научно-исследовательской деятельности;

– выяснить мотивы поступления в магистратуру;

– определить область научных интересов;

– определить уровень научной эрудиции претендента.

Формат вступительного испытания

Вступительное испытание проводится в форме устной беседы и свободного обсуждения с абитуриентом материалов его профессионального портфолио.

Устная беседа проводится экзаменационной комиссией с каждым абитуриентом индивидуально. Абитуриенту задаются вопросы, которые позволяют оценить его профессиональный и личностный потенциал. На каждого абитуриента отводится не более 30 мин. Предварительно составляется список, в котором за каждым абитуриентом закрепляется время проведения собеседования. Список формируется с учетом пожеланий абитуриентов, публикуется в интернете и является доступным для всех участников собеседования. Собеседование проводится после объявления итогов конкурса портфолио согласно графику вступительных испытаний.

Перечень примерных вопросов

1.  Блок вопросов на мотивацию – рассказать о причинах поступления в магистратуру, об опыте участия в проектах или исследованиях, связанных с компьютерной лингвистикой, опыте прохождения он-лайн курсов, чтения специальной литературы

2.  Блок вопросов на эрудицию – рассказать о лингвистических ресурсах и их использовании, о ключевых конференциях по компьютерной лингвистике, о лингвистических парсерах, о соревнованиях лингвистических систем

3.  Блок вопросов на подготовленность:

вопрос типа кейс – выстроить цепочку лингвистических модулей для решения заданной задачи

например: для задачи оценки тональности будут последовательно применены модули обработки текста (токенизация, лемматизация), модуль обращения к словарю тонально окрашенных слов и выражений, модуль с правилами поиска тональных слов и правилами вычисления итоговой тональности.

вопрос типа рецензия – ознакомиться с текстом на профессиональную тему, изложить основные тезисы, дать собственную оценку.

4.  Блок вопросов на знакомство с программой и школой лингвистики: рассказать о проектах программы и школы, которые заинтересовали, рассказать о том, чем хотелось бы заниматься в магистратуре и после магистратуры.

Критерии оценок

Ответы каждого блока вопросов оценивается по 20-балльной системы:

·    15-20 – высокий уровень подготовленности абитуриента (абитуриент исчерпывающе ответил на все или почти все вопросы блока)

·    10-15  — средний уровень подготовленности абитуриента ( абитуриент исчерпывающе ответил на 50-70% вопросов блока)

·     5-10 – слабый уровень подготовленности абитуриента ( абитуриент исчерпывающе ответил на 30-50% вопросов блока)

·     0-5 – неподготовленность абитуриента (абитуриент исчерпывающе ответил на менее, чем 30% вопросов блока)


Образовательная программа «Фундаментальная и компьютерная лингвистика» — Национальный исследовательский университет «Высшая школа экономики»

Детализированная информация по оценкам доступна каждому студенту и преподавателям НИУ ВШЭ через систему LMS

Студент

Позиция в рейтинге

Средний балл

Минимальный балл

Перцентиль

GPA

Бурлаков Филипп Юрьевич19.590%9.53
Лобанова Алина Вадимовна29.680.94%9.47
Землянская София Александровна3 — 49.481.89%9.45
Хургес Алина Михайловна3 — 49.581.89%9.45
Сидоркина Дарья Сергеевна59.383.77%9.42
Корнилова Анастасия Андреевна6 — 89.284.72%9.37
Неминова Екатерина Сергеевна6 — 89.284.72%9.37
Шерман Ксения Валерьевна6 — 89.484.72%9.37
Иванов Даниил Константинович9987.55%9.34
Дунаева Ксения Олеговна10 — 119.278.49%9.29
Шикунова Александра Сергеевна10 — 119.478.49%9.29
Маринина Валерия Владимировна129710.38%9.18
Камаева Элина Петровна13 — 149811.32%9.16
Степанянц Максим Гургенович13 — 149.1811.32%9.16
Дьячкова Мария Дмитриевна159.2813.21%9.13
Алексеева Анастасия Павловна168.9714.15%9.11
Шепель Екатерина Алексеевна179.1815.09%9.08
Суворова Мария Сергеевна189.2816.04%9.05
Козлов Дмитрий Михайлович19 — 219.3816.98%9.03
Лукьянова Таисия Павловна19 — 219.1816.98%9.03
Политова Ирина Сергеевна19 — 219616.98%9.03
Иванова Анастасия Дмитриевна229.1819.81%9.00
Козлова Екатерина Руслановна239720.75%8.97
Малахова Полина Сергеевна24 — 258.7621.7%8.95
Тимофеева Виктория Дмитриевна24 — 258.6721.7%8.95
Третьякова Полина Дмитриевна268.5723.58%8.92
Астафьев Павел Николаевич279724.53%8.89
Паршина Ирина Сергеевна288.9725.47%8.87
Дедов Тимофей Геннадьевич298.9726.42%8.82
Нужненко Александра Сергеевна30 — 318.5627.36%8.79
Сухарева Мария Игоревна30 — 318.6727.36%8.79
Анисимова Ксения Денисовна328.9729.25%8.76
Князькова Виктория Игоревна33 — 348.4630.19%8.68
Шакирова Софья Маратовна33 — 348.5230.19%8.68
Васильева Варвара Вячеславовна35 — 368.6832.08%8.66
Войтович Екатерина Евгеньевна35 — 368.2432.08%8.66
Андреева Анастасия Андреевна378.7733.96%8.63
Широков Иван Алексеевич388.4634.91%8.61
Куликова Анна Андреевна398.5735.85%8.58
Ревак Ксения Зореславовна408.6636.79%8.50
Югай Максим Олегович418.3637.74%8.47
Кузнецова Светлана Васильевна42 — 448.4638.68%8.45
Ткач Анна Сергеевна42 — 448.6638.68%8.45
Тушевская Ксения Сергеевна42 — 448.6738.68%8.45
Берлин Влада Антоновна458641.51%8.39
Детюк Дарья Александровна468.2742.45%8.37
Елагина Анна Александровна47 — 488.3743.4%8.32
Морозова Дарья Алексеевна47 — 488.5743.4%8.32
Аскарова Диана Римовна49 — 528.4645.28%8.26
Зенина Алёна Геннадьевна49 — 527.8645.28%8.26
Майорова Светлана Александровна49 — 528.1645.28%8.26
Островская Мария Сергеевна49 — 528.1645.28%8.26
Зверева Арина Михайловна53 — 547.6549.06%8.24
Тулубьева Анастасия Дмитриевна53 — 548.3549.06%8.24
Зайцева Елена Сергеевна55 — 568.4650.94%8.18
Минвалеева Фатима Руслановна55 — 568.1650.94%8.18
Беклемишев Никита Львович578.1752.83%8.16
Коченова Лора Александровна588653.77%8.13
Землянская София Сергеевна597.9554.72%8.11
Кочеткова Ирина Игоревна60 — 618555.66%8.05
Синева Екатерина Максимовна60 — 617.9655.66%8.05
Еремичева Татьяна Андреевна627.82357.55%8.02
Степанова Ангелина Михайловна637.8558.49%8.00
Ахметшина Екатерина Алексеевна647.9759.43%7.92
Кученина Анна Евгеньевна657.7560.38%7.87
Смыр Полина Романовна667.9661.32%7.84
Давлеева Варвара Альбертовна677.6562.26%7.74
Оспанова Дана687.6563.21%7.71
Карпова Аполлинария Павловна697.7664.15%7.63
Смирнова Варвара707.4665.09%7.61
Красновид Анжелика Евгеньевна717.7666.04%7.58
Ольшевская Елена Сергеевна727.4666.98%7.47
Ермакова Алёна Михайловна737.3667.92%7.37
Леонтович Наталия Александровна747.1568.87%7.26
Ковтун Татьяна Анатольевна757.3569.81%7.24
Чиркин Андрей Дмитриевич767.3670.75%7.21
Шемшурина Елизавета Анатольевна776.8571.7%7.11
Тарасов Александр Сергеевич786.4572.64%6.79
Самигуллина Альмира Тагировна797.4473.58%6.55
Аверьянова Екатерина Витальевна806.5474.53%6.50
Стойкович Ивана816.3175.47%6.47
Корнеева Софья Ильинична825476.42%6.45
Фадеева Полина Львовна835.6377.36%6.34
Кумараге Нагасингхе Вишва Сохан846.7478.3%6.29
Ким Александр Николаевич856479.25%6.13
Звягина Юлия Константиновна865.5280.19%6.03
Псарёва Надежда Николаевна876.5381.13%6.00
Мещерякова Евгения Александровна886.2382.08%5.76
Реттер Полина Вадимовна89 — 905383.02%5.63
Цатурян Анна Арменовна89 — 905.6083.02%5.63
Сычева Анастасия Сергеевна915.5284.91%5.08
Ематинова Евангелина Юрьевна925.1185.85%4.97
Осоргин Иван Геннадьевич935.6286.79%4.71
Лазаренко Никита Витальевич944.4187.74%4.66
Гараев Руслан Айратович953.2088.68%4.34
Вейсброд Диана Олеговна963.8089.62%4.00
Жильцов Даниил Андреевич973.1190.57%2.95
Чумакова Ольга Романовна982.4091.51%2.79
Рябушкина Ольга Витальевна992.22092.45%2.56
Проскурякова Дарья Александровна1002.4493.4%2.47
Арчакова Амина Иссаевна1011.9094.34%2.05
Артамонова Анна Александровна1021.1295.28%1.34
Рязанкин Кирилл Алексеевич1031.1196.23%1.26
Кротова Алина Антоновна1040.7197.17%0.71
Прозоров Алексей Дмитриевич1050.3098.11%0.55
Персиц Софья Сергеевна10600100%0.00

Магистерская программа «Компьютерная лингвистика» — Национальный исследовательский университет «Высшая школа экономики»

Студент

Позиция в рейтинге

Средний балл

Минимальный балл

Перцентиль

GPA

Языкова Татьяна Владимировна19.890%9.80
Игнатьев Даниил Дмитриевич29.794.55%9.64
Петрова Дарья Сергеевна39.289.09%9.20
Капелюшник Денис Михайлович49.3713.64%9.16
Надиманов Эмиль Ильдарович59818.18%8.98
Ларионов Даниил Сергеевич68.9722.73%8.95
Хумонен Иннокентий Сергеевич78.9627.27%8.93
Баранов Александр Михайлович88.8731.82%8.82
Логин Никита Вячеславович98.6736.36%8.66
Юдина Татьяна Александровна108.6740.91%8.55
Казакова Лилия Ильдаровна118.1645.45%8.09
Сафонова Анастасия Александровна128.4650%8.07
Киселева Наталья Михайловна137.9454.55%7.86
Клезович Анна Геннадьевна148659.09%7.80
Никитин Илья Александрович157.9 563.64%7.77
Аракелова Дарья Антоновна168268.18%7.75
Быстрова Ольга Владимировна177.5272.73%7.61
Захарова Алина Андреевна187.5577.27%7.43
Копачинская Анастасия Евгеньевна197.2581.82%7.02
Додонова Екатерина Денисовна206.5386.36%6.07
Дэвенпорт Сидни Джинн213.2690.91%3.25
Климов Роман Алексеевич222.6095.45%2.84

Рейтинги студентов за предыдущие периоды

Расчет и публикация рейтингов студентов осуществляется на основании Положения о рейтинговой системе комплексной оценки знаний студентов образовательных программ бакалавриата, специалитета и магистратуры Национального исследовательского университета «Высшая школа экономики»

Детализированная информация по оценкам доступна каждому студенту и преподавателям НИУ ВШЭ через систему LMS

Выпускные квалификационные работы — Страница 2 — Магистерская программа «Компьютерная лингвистика» — Национальный исследовательский университет «Высшая школа экономики»

Выпускные квалификационные работы (ВКР) в НИУ ВШЭ выполняют все студенты в соответствии с университетским Положением и Правилами, определенными каждой образовательной программой.

Аннотации всех ВКР в обязательном порядке публикуются в свободном доступе на корпоративном портале НИУ ВШЭ.

Полный текст ВКР размещается в свободном доступе на портале НИУ ВШЭ только при наличии согласия студента – автора (правообладателя) работы либо, в случае выполнения работы коллективом студентов, при наличии согласия всех соавторов (правообладателей) работы. ВКР после размещения на портале НИУ ВШЭ приобретает статус электронной публикации.

ВКР являются объектами авторских прав, на их использование распространяются ограничения, предусмотренные законодательством Российской Федерации об интеллектуальной собственности.

В случае использования ВКР, в том числе путем цитирования, указание имени автора и источника заимствования обязательно.

Реестр дипломов НИУ ВШЭ

2020

Бакшандаева Дарья Дмитриевна

 

2020

Пожидаева Марина Александровна

 

2020

Власов Владимир Павлович

2020

Михайлов Владислав Николаевич

 

2020

Митрофанова Марина Алексеевна

 

2020

Виногородский Константин —

 

2020

Сорокин Семен Александрович

2020

Яскевич Алексей Аркадьевич

 

2020

Хорошева Анастасия Алексеевна

2020

Плетенев Сергей Александрович

2020

Бабаков Николай Сергеевич

2020

Никифорова Анастасия Владимировна

2020

Фомин Вадим Вячеславович

 

Архангельский Тимофей Александрович  

2019

Андриянец Василиса Андреевна

 

2019

Самойленко Ксения Владимировна

2019

Степанов Артём Алексеевич

 

Кутузов Андрей Борисович  

2019

Бакаров Амир Асхатович

2019

Тихомиров Даниил Олегович

 

2019

Климов Александр Антонович

 

2019

Соколова Ирина Сергеевна

2019

Шеянова Мария Викторовна

 

2019

Семенова Наталья Александровна

 

2019

Кузнецова Анастасия Дмитриевна

 

2019

Степачёв Павел Эдуардович

 

2019

Кротова Ирина Витальевна

 

2019

Фёдорова Мария Валерьевна

 

2019

Никишина Ирина Александровна

 

2019

Лапидус Анна Александровна

 

2019

Краснов Станислав Станиславович

 

2019

Баранчикова Анастасия Денисовна

 

Отзывы выпускников о программе — Магистерская программа «Компьютерная лингвистика» — Национальный исследовательский университет «Высшая школа экономики»

 
Михайлов Сергей

выпускник 2018 года

«На программу я поступил, не имея никакого опыта, связанного с лингвистикой, ведомый исключительно огромной мотивацией и интересом к этой сфере знаний. Честно говоря, во время обучения не разделял предметы по принципу «нравится/не нравится», потому что просто-напросто впитывал все, как губка 🙂 Благодаря обучению на магистерской программе «Компьютерная лингвистика» мне удалось приобрести знания, которые позволили мне устроиться на работу по специальности уже во время обучения, на втором курсе (работа связана с извлечением информации из медицинских текстов). Пользуясь случаем, выражаю огромную благодарность всем преподавателям и учебному офису программы, которые были готовы в любое время дня и ночи помочь, подсказать, научить и наставить на путь истинный! :)»

 

Клячко Елена
Магистр, выпускница 2014 года

Благодаря обучению в магистратуре, я получила полезные навыки в самостоятельной организации работы, приобрела множество полезных технических знаний (разработка на Python, библиотеки для обработки текста). Кроме того, я познакомилась с людьми, которые занимаются интересными мне областями науки (создание корпусов для малых языков). У нас также была возможность посещать общефакультетские факультативы (например, курс Барбары Парти по формальной семантике). В целом, я поняла, чем именно хочу заниматься в компьютерной лингвистике, стала более самостоятельна в своей работе.

Панова Татьяна
Магистр, выпускница 2015 года

В этом учебном году я стипендиант в библиотеке/ культурном центре «Yiddish Book Center» в Америке в городе Амхерсте, штат Массачусетс. Эта организация выкладывает в открытый доступ огромное количество отсканированных книг на идише. В основном моя работа — подстраивать поисковик на нашем сайте yiddishbookcenter.org так, чтобы эти книги можно было легко найти. Так что то, чему меня учили в Вышке, мне очень даже пригодилось!

Трофимова Дарья
Магистр, выпускница 2015 года

  • Как Вы узнали программе “Теория языка и компьютерная лингвистика”? Можно ли сказать, что эта программа уже хорошо известна среди лингвистов России?

О программе я узнала из Википедии. Не могу говорить за всех лингвистов России, но,  на мой взгляд, упоминание в Википедии является хорошим показателем известности.

  • Какими критериями Вы руководствовались при выборе программы? Оправдались ли в итоге ожидания?

В двух словах — мне хотелось компьютеров и лингвистики. В результате нас научили обрабатывать естественный язык автоматически и познакомили с современными теориями в лингвистике, так что да, ожидания полностью оправдались.

  • Многие думают, что лингвист занимается исключительно переводом. Скажите, пожалуйста, действительно ли область, где лингвист может применить свои знания и умения, значительно шире? Не могли бы Вы привести несколько примеров?

Будет точнее сказать, что область, где лингвист может применить свои знания, не шире перевода, а что перевод  — это одно из многочисленных направлений лингвистики, и в любом из них лингвист свободен применять свои знания и умения.  Например, существует определенное количество направлений лингвистики, в которых можно проводить теоретические исследования – таких как, синтаксис, семантика, прагматика, и немного меньшее количество областей, в которых теория языка используется для решения практических задач – перевод, компьютерная лингвистика, лингвистическая экспертиза, преподавание. 

  • В чем, по Вашему мнению, заключается особенность компьютерной лингвистики?

Я не считаю, что компьютерная лингвистика – особенная и что нам надо говорить о её отличиях и особенностях. Точно так же, как и любая прикладная отрасль науки, компьютерная лингвистика опирается на достижения наук теоретических, чтобы  менять мир к лучшему. Компьютерная лингвистика – исследования и обработка языка с помощью компьютерных или математических методов, компьютерная томография – получение послойного изображения структуры объекта компьютерными методами, то есть «компьютерный» здесь, прежде всего,  означает основной метод для решения задач в данной области.

  • Были ли у Вас возможности познакомиться с профессией во время обучения? Практики, стажировки, мастер-классы?

Да, разумеется. На мой взгляд, обучение в магистратуре в Школе лингвистики направлено, прежде всего, на практику, студентов готовят к тому, что может встретить их в жизни после окончания магистратуры. Нам проводили мастер-классы сотрудники как ведущих российских IT-компаний, так и стартапов, рассказывали и показывали то, чем они занимаются. Это всегда было интересно, потому что такие мастер-классы – наглядный пример того, где и как современный компьютерный лингвист может самореализоваться. На стажировку нас приглашали российские компании и научные учреждения, поэтому у нас также была возможность посмотреть и сравнить, какие задачи решают лингвисты в  IT-индустрии  и в науке.

  • Как Вы оцениваете перспективы трудоустройства по окончании магистерской программы? Есть ли возможность выбирать между российскими и зарубежными компаниями?

Я начала работать по специальности после окончания первого курса магистратуры, поэтому можно уверенно утверждать, что то, чему нас учат на программе компьютерной лингвистики, и то, как нас этому учат, востребовано на рынке труда.  Удачно и то, что во время обучения нас знакомят с деятельностью  различных компаний из IT-индустрии, и можно получить представление о том, чем ты хочешь заниматься в профессиональной деятельности. 

  • Расскажите,  пожалуйста, о своей работе. Чем занимается Ваша компания? 

Я работаю в компании News360 — системе персонализации новостей.  Мы обрабатываем сотни тысяч новостей  в день, и основными задачами системы является определить темы статьи и составить для пользователя ленту новостей, максимально соответствующую его интересам. 

  • Какова ваша роль в компании? Что входит в круг Ваших профессиональных обязанностей?

В компании я — компьютерный лингвист. В News360 лингвисты отвечают за то, чтобы новости получали правильные теги  — то есть за категоризацию (автоматическое выделение тем новостей), NEL (Named Entity Linking, поиск сущностей в новостях и их дизамбигуация). Оценка качества работы лингвистических модулей системы, оптимизация существующих алгоритмов, разработка и имплементация новых – всё это также задачи, которые решает наша NLP-команда.  

  • Какие знания и навыки, полученные во время обучения в ВШЭ, особенно полезны для Вашей работы?

Умение бесстрашно браться за решение неизвестных задач и успешно их решать. Из менее философского, но не менее полезного – знания о современных методах компьютерной лингвистики и навыки программирования. 

  • Планируете ли Вы поддерживать связь с ВШЭ?

Да, безусловно. Два года магистратуры в ВШЭ были одним из самых приятных и незабываемых с точки зрения образования. Связь с ВШЭ хочется не терять – сейчас, например, в компании, где я работаю, проходят стажировку двое студентов из Школы лингвистики.

  • Есть ли у Вас секрет успеха (или просто совет), которым Вы готовы поделиться с будущими студентами-лингвистами? 

Секреты успеха, которыми принято делиться, мне кажутся слишком общими и неприменимыми в реальной жизни для конкретного человека. Бесполезно советовать  –  «учитесь», «узнавайте новое», «делайте так, чтобы всё работало»,  это довольно очевидные вещи. Поэтому нет, у меня нет особенных советов для будущих студентов-лингвистов. Разве что…  Делайте лингвистику, делайте её компьютерными и математическими методами, и всё получится.

 

Компьютерная лингвистика – Центр открытого образования «Addenda» – Национальный исследовательский университет «Высшая школа экономики»

Программа профессиональной переподготовки

Программа “Компьютерная лингвистика” дает возможность слушателям, имеющим гуманитарное образование, овладеть современными инструментами автоматического анализа текста, освоить ключевые методы лингвистических технологий, обучиться использованию и оценке лингвистических парсеров, созданию корпусов, словарей и онтологий. Слушатели программы получают новую востребованную специальность. Программа предусматривает работу над исследовательским проектом и стажировку в профильных коммерческих компаниях и научно-исследовательских институтах.

Особенности программы

Чему вы научитесь?

  • Писать скрипты на Питоне для обработки текстов
  • Создавать и обрабатывать собственные корпуса текстов
  • Использовать статистические методы для анализа и визуализации текстовых параметров с помощью языка R
  • Использовать алгоритмы машинного обучения для классификации и кластеризации текстов, а также алгоритмы “deep learning”
  • Работать с лексикографическими инструментами, инструментами создания онтологий, параллельными двуязыковыми корпусами
  • Создавать правила, позволяющие автоматически извлекать информацию из массивов текста

Что вы узнаете?

  • Чем занимается современная компьютерная лингвистика?
  • Что включает в себя лингвистическая обработка текста?
  • Какие существуют полезные ресурсы и инструменты и как с ними работать?
  • Как измерять качество работы модулей лингвистического анализа?
  • Как ранжировать слова по значимости в текстах, по связанности между собой?
  • Какие подходы используются для машинного перевода?
  • Как автоматически определить “тональность” текста?
  • Как получить структурированные данные из неструктурированного текста?
Формат обучения

Начало обучения: 11 октября 2021 года (прием документов до 7 октября)

Форма обучения: Дистанционная, заочная

График обучения: понедельник, среда с 19:10 до 22:00, суббота с 10:30 до 13:30

Общий срок обучения: 8 месяцев

Общая трудоёмкость: 844 академических часа, в т.ч. 306 аудиторных часов

Преподаватели

Шеянова Мария Викторовна

Департамент больших данных и информационного поиска: Приглашенный преподаватель

 

Документ об окончании

Оставить отзыв о программе

Вам также могут быть интересны

Фундаментальная и компьютерная лингвистика — образовательная программа НИУ ВШЭ

Направление

ВсеАэронавигация и эксплуатация авиационных и ракетно-космических технологийСельское, лесное и рыбное хозяйствоПрикладная геология, горнодобывающая промышленность, нефтегазовая промышленность и геодезияАрхитектураИскусство ИсследованияАвиационные и ракетно-космические технологииБиологические наукиХимические наукиХимические технологииХимияКлиническая медицинаКомпьютерные и информационные наукиКонструкторские исследования и социальные науки и менеджментОбразование и педагогические наукиЭлектроэнергетика и теплоэнергетикаЭлектроника, радиотехника и системы связиИнжиниринг и технологии Наземный транспортИнжиниринг и технологии судостроения и водного транспортаФундаментальная медицинаГрафическое и прикладное искусствоЗдоровье и профилактическая медицинаИстория и археологияИндустриальная экология и биотехнологииИнформационная промышленностьИнформационные технологии В технических системах СМИ и информатика-библиотечное делоМатематика и механикаМеханическая инженерияНанотехнологии и наноматериалыЯдерная инженерия и технологииМедицинское обслуживаниеФармацияФилософия, этика и религиоведение Материалы Техносферная безопасность и экологическая инженерия Теология Ветеринария и зоотехника

Субъект

AllAgricultural EngineeringAgricultureAircraft EnginesAllergology и ImmunologyAnestesiology и ReanimatologyAnimal Orogin FoodAnthropology и EthnologyApplied GeologyApplied InformaticsApplied MathematicsApplied Математика и InformaticsApplied Математика и PhysicsApplied MechanicsArchitectureArchutecture Environmental DesignArt и HumanitiesArt HistoryArt Погрузочно-разгрузочное TechnologyArtsArts и Fine ArtsAstronomyAutomation технологических процессов и ProductionsAviation и ракетно-космической TechnologyAviation и исследованию космического пространства MedicineBacteriologyBallistics и HydroaerodynamicsBioengineering и BioinformaticsBiologyBiology ScienceBiotechnical Системы и технологииБиотехнологииБизнес-информатикаКардиологияСердечно-сосудистая хирургияКартография и геоинформатикаХимические наукиХимические технологииХимическая технология материалов современной энергетикиХимияХимия, физика и механика материаловГражданское строительствоКлиническая лаборатория диагностикиКлиническая медицинаКлинический фармаколог yКлиническая психологияКолопроктологияКоммерцияКомпьютерные и информационные наукиКомпьютерная безопасностьКонфликтологияСтроительство, эксплуатация, восстановление и техническое покрытие автомагистралей, мостов и туннелейКосметологияКультурологияТаможняСтоматологическая хирургияДерматовенерологияДизайнДизайн и технологическая поддержка машиностроительной промышленностиДизайн электронных технологийЭкономика и ракетные наукиДизайн электронных технологийЭкономика и ракетные науки Использование двигателей ТеплоэнергетикаЭлектронные и оптико-электронные устройства и системы специального назначенияЭлектроника и наноэлектроникаЭлектроника, радиотехника и системы связиЭлектронная медицинаЭндокринологияЭндоскопияИнжиниринг и технологии Наземный транспортИнжиниринг и технологии Судостроение и водный транспортЭкологическая инженерия и водопользованиеЭпидемиологияЭпидемиологияЭксплуатация транспортных технологий s и ComplexesFair SafetyFinance и CreditFine ArtsFolk Art CultureForeign Регион StudiesForensic ExaminationForensic MedicineForestryFunctional DiagnosticsFundamental и прикладная ChemistryFundamental Математик и MechanicsFundamental MedicineFundamental наука и информация TechnologiesGastroenterologyGeneral DentistryGeneral практика (семейная медицина) GeneticsGeodesy и удаленный SensingGeographyGeologyGeology, разведка и управление ресурсами DevelopmentGeriatricsHealthcare и общественная HealthcareHeat питание и тепло EngineeringHeat-и -ЭнергетикаГематологияВысокие технологии и инновации ЭкономикаВысокотехнологичная отрасль функциональных и специальных пищевых продуктовИсторические науки и археологияИстория искусстваГидрометеорологияПромышленная экология и биотехнологииИнфекционные заболеванияИнформатика и компьютерные технологииИнформационная безопасностьИнформационная безопасность компьютерных системИнформационная безопасность телекоммуникационных системИнформационные системы и технологии Ионные исследованияИнструментальная инженерияУправление интеллектуальной собственностьюИнтеллектуальные системы в сфере гуманитарных наукМеждународные отношенияЖурналистикаЛабораторная генетикаУправление землями и кадастрыЗемельные транспортно-технологические комплексыЛандшафтная архитектураЛазерное оборудование и лазерные технологииЗаконодательство МашиностроениеМеханика и математическое моделированиеМехатроника и робототехникаМедиа-коммуникацииМедицинская и социальная экспертизаМедицинская биохимияМедицинская биофизикаМедицинское делоМедицинская стоматологияМедицинско-профилактическое делоМедицина и наркологияМеталлургияГорное делоМузейное дело и защита объектов культурного и природного наследия sNanotechnNanotechnologies и микросистемная Technicsologies и микросистемная technicsNanotechnologies и Микросистемное TechnicsNanotechnologies и NanomaterialsNeonatologyNephrologyNeurologyNeurosurgeryNuclear Энергетик и Термальный PhysicsNuclear Физика и TechnologiesNuclear растения: Проектирование, эксплуатация и EngineeringNuclear Реакторы и MaterialsNuclear Реакторы и MaterialsNuclear, тепло и возобновляемые источники энергия и связанный с ними TechnologiesNursingNutrition HygieneObstetrics и GynecologyOil и газом BusinessOil и газом инженерным и технологииОнкологияОфтальмологияОптическая техникаОрганизация работы с молодежьюВосточные и африканистические исследованияОртодонтияОртопедическая стоматологияОториноларингологияПатологическая анатомияПедагогическое образование (с двумя профилями образования) Педагогика и психология девиантного поведенияПедиатрическая стоматология, хирургию и педиатрия s ИсследованияФотоника и оптоинформатикаФотоника, приборы, оптические и биотехнологические системы и технологии productionPhysiotherapyPlant Происхождение FoodPlastic SurgeryPolitical наук и региональных StudiesPolitologyPower и ресурсосбережение процессы в химической технологии, нефтехимии и BiotechnologyPower Mechanical EngineeringPR и СМИ RelationsProfessional PathologiesPsychiatryPsychological SciencesPsychologyPsychology и педагогической EducationPsychology профессиональной ActivityPsychotherapyPublic HelthcarePublic политики и социальной SciencesPublishing IndustryPulmonologyQuality managementRadiation HygieneRadio TechnicianRadio-электронных систем и ComplexesRadiologyRadiophys Рентген-эндоваскулярная диагностика и лечениеРентгенологияРентгенологияРентген-эндоваскулярная диагностика и лечение Инженерные системыСпециальный транспорт организация общественного потребления продуктов питанияТехнология транспортных процессовТехнология продуктов легкой промышленностиТехносферная безопасностьТелевидениеТехнология печати и упаковки

Докторант лингвистики НИУ ВШЭ

Докторант лингвистики

Школа лингвистики

НИУ ВШЭ

Москва, Россия

Высшая школа экономики Школа лингвистики в Москве, Россия, приглашает заявки на постдокторантуру в одной из следующих областей: овладение вторым языком, компьютерная лингвистика, машинное обучение, корпусная лингвистика, славянские языки, компьютерная лексикография, типология, лексическая семантика, строительная грамматика, социолингвистика, история языка.

О НИУ ВШЭ

Высшая школа экономики (НИУ ВШЭ) — молодой, динамичный и быстрорастущий российский исследовательский университет. За последние 25 лет НИУ ВШЭ стала лидером в российском образовании, а также получила признание во всем мире.

Например, мы были первым государственным университетом в России, который начал набор на международный академический рынок. Мы стремимся быть университетом с тщательно продуманным подходом к обучению новых специалистов.Поэтому мы стремимся нанимать людей с реальным опытом, а также базовыми и прикладными знаниями. Стремясь к высококачественным исследованиям, в НИУ ВШЭ сегодня насчитывается более 100 исследовательских институтов и центров и более 30 международных исследовательских лабораторий, сотрудничающих с международными специалистами со всего мира.

Требования

Общие требования к постдокторской стипендии следующие:

  • Кандидаты должны иметь недавнюю докторскую степень в области лингвистики, славянских языков, информатики или смежных областей, которая была присуждена за последние 5 лет или получена до начала работы в НИУ ВШЭ в соответствующей области международным признанный университет и был оценен внешними рецензентами как имеющий потенциал для проведения исследований, которые могут быть опубликованы в ведущих рецензируемых журналах;
  • Кандидаты должны иметь сильный опыт в области вычислительных, экспериментальных, полевых, корпусных или теоретических методов лингвистики, способность работать в команде, проводить и публиковать высококачественные исследования.
  • Свободное владение английским языком является обязательным условием, так как исследования и другие мероприятия проводятся на английском языке. Знание русского языка не требуется;
  • Соответствующий опыт будет достоинством, хотя и не требуется.

Позиция включает:

  • работает под непосредственным руководством Екатерины Рахилиной;
  • участников поощряются к проведению собственных исследований наряду с работой над исследовательскими проектами Школы лингвистики, такими как:
    • Корпус ученика
    • Типологический корпус
    • Корпус детской речи
    • Словари для учащихся
    • Лингвистическая вариация
    • Русский жестовый язык
    • База данных Российских построек (Конструктикон)
    • База данных диахронических изменений
  • Написание
  • научных статей для международных рецензируемых журналов в соавторстве с членами Школы лингвистики;
  • участие в мероприятиях Школы лингвистики и другой вклад в ее развитие;
  • публичных презентаций собственных исследований кандидата академическому сообществу;
  • Некоторое обучение приветствуется, но не требуется.

Условия

Назначения обычно производятся на один год. У докторантов есть возможность продления контракта (не более двух раз).

НИУ ВШЭ предлагает аспирантам конкурентоспособную заработную плату, стандартный план медицинского страхования, рабочее место с компьютером и бесплатный доступ в Интернет в университете.

Школа лингвистики предлагает доступ к своим базам данных и электронным ресурсам.

Процесс подачи заявки

Заявки необходимо подавать онлайн.Пожалуйста, предоставьте резюме, заявление об исследовательском интересе и недавний исследовательский документ, поданный через онлайн-форму заявки. По крайней мере, два рекомендательных письма должны быть отправлены напрямую в Международный отдел найма преподавателей по адресу: сочинитель @hse.ru до истечения срока подачи заявок. Обращаем ваше внимание, что прямые заявки в приемную школу могут не рассматриваться.

Подробнее о процессе подачи заявки здесь.

Последний срок приема заявок — 9 февраля 2020 года.

Ссылка на страницу приложения: https://iri.hse.ru/linguistics

Computational Communication Research in Central and Eastern Europe

Региональная конференция МКА по Вычислительные коммуникационные исследования в Центральной и Восточной Европе будет состоится в г.Петербург, Россия, 27-29 июня 2022 года. конференция призвана консолидировать региональное сообщество в зарождающемся область вычислительной связи исследования и внести свой вклад в его более тесная интеграция с мировым сообщество вычислительных специалисты по коммуникации, как внутри и помимо текущего членства в МКА.

Мероприятие будет проводиться в смешанный онлайн-офлайн формат — эпидемиологические условия и наличие разрешения на поездку — или полностью онлайн как обстоятельства могут потребовать.

Конференция организована Лаборатория социально-познавательного информатика, часть Санкт-Петербургского государственного университета им. Петербургский кампус НИУ ВШЭ.

Национальный центр интеллектуального анализа текстов — NaCTeM — HSE Lloyds

Введение

Проект Lloyds HSE находится под эгидой программы Discovering Safety стоимостью 10 миллионов фунтов стерлингов, финансируемой Lloyd’s Register Foundation.Центральное место в программе занимает разработка новых технологий для анализа данных и агрегирования данных из источников по всему миру, ключевым результатом которых является новое обучение, помогающее предотвращать несчастные случаи в будущем. Эта амбициозная программа является результатом сотрудничества между Управлением здравоохранения и безопасности (HSE) и Манчестерским университетом в рамках Института Томаса Эштона. В рамках программы мы используем новейшие разработки в области интеллектуального анализа текста и обработки естественного языка для извлечения информации о здоровье и безопасности из текстовых источников.

Цели и задачи

Обширный и разнообразный архив данных по охране труда и здоровья, накопленный из года в год в результате инспекций рабочих мест, расследования инцидентов и правоприменительной деятельности, наряду с информацией об инцидентах, переданной в HSE ответственными лицами, предоставляет готовый набор исследовательских данных для поддержки создания экосистемы для автоматического получения информации и поддержки оценки рисков для здоровья и безопасности. Для достижения этой цели цели этого проекта:

  • для идентификации групп тематически связанных документов и создания информативных меток для характеристики содержания каждой темы с использованием тематического анализа и описательной кластеризации;
  • для настройки и интеграции ресурсов и инструментов интеллектуального анализа текста для обогащения данных о здоровье и безопасности семантическими метаданными (терминами, именованными объектами и связями), автоматически извлекаемыми из отчетов с произвольным текстом;
  • для автоматического поиска и оценки факторов риска с использованием контекстной классификации;
  • для реализации и оценки интерактивной и фасетной системы семантического поиска для поддержки обнаружения на основе методов расширения и отображения запроса;
  • для автоматического суммирования отчетов на основе рисков и другой актуальной семантической информации;
  • , чтобы продемонстрировать вышеуказанные методологии на конкретном примере.

Рамка

  • Поиск информации
    Выходя за рамки запросов по ключевым словам, мы используем сочетание машинного обучения и интеллектуального анализа текста для извлечения релевантной информации из отчетов об инцидентах, связанных с охраной труда и техникой безопасности, или отчетов об инспекциях.
  • Извлечение информации
    Мы используем методы извлечения информации для автоматического извлечения определенных сущностей, на которые есть ссылки в текстовых данных, например, людей, растений и мест, относящихся к рабочему месту, наряду с любыми ссылками на ключевые свойства, процессы и лежащие в основе ассоциации.Извлеченная информация будет интегрирована с традиционными упражнениями по анализу первопричин или с обычным использованием классификаций и таксономий опыта эксплуатации. Семантические аннотации и инструменты извлечения информации будут поддерживать обнаружение знаний, поиск и другие приложения, например инструменты диагностики, оптимизация, прогнозный анализ и т. д. Мы используем APLenty, инструмент аннотации для создания высококачественных наборов данных с маркировкой последовательностей с использованием активного и упреждающего обучения, для создания помеченных данных.
  • Оценка рисков
    После того, как свободный текст был эффективно аннотирован, его содержание можно затем использовать в более количественных статистических анализах логического типа. Например, исторические результаты инспекций могут быть использованы для получения информации, которая поможет наметить будущие усилия и объем инспекций.
  • Семантические / когнитивные приложения
    Преобразование знаний в понимание требует понимания, суждения и интеллекта, которые исторически зависели от участия человека.Ключевые области когнитивных приложений будут включать: а) семантический поиск для извлечения информации из баз знаний, б) классификацию для поддержки систем оценки рисков и рекомендаций, в) обобщение документов.

Прототип системы семантического поиска

Прототип сетевой системы, обеспечивающей семантически расширенный поиск по коллекции отчетов о несчастных случаях на рабочем месте (RIDDOR), теперь доступен по адресу http://www.nactem.ac.uk/hse/.

Также доступно видео, демонстрирующее функциональность системы.

Новости

21 июля 2021 года

Система семантического поиска HSEarch находится в центре внимания новостной статьи под названием «В шахте данных, что-то шевелится …» на ITTHub.net, в которой представлены новости, мнения и анализ инноваций и технологий в дорожном транспорте. В статье описывается, как система позволяет менеджерам по охране труда и технике безопасности, подрядчикам и инспекторам ОТОСБ извлекать подходящие критически важные для безопасности концепции и ассоциации без трудоемкого просмотра тысяч страниц текста, а также приводятся цитаты из интервью с директором NacTeM, проф.София Ананиаду, а также Тим Йейтс, аналитик данных НИУ ВШЭ.

25 июля 2019

Мы заняли первое место в общей задаче обобщения научных документов по компьютерной лингвистике (CL-SciSumm 2019) на 42-й Международной конференции ACM SIGIR по исследованиям и разработкам в области информационного поиска, Париж, Франция.

Публикации

Эмра Инан, Пол Томпсон, Тим Йейтс и Ананиаду, С. (2021 г.). HSEarch: система семантического поиска сообщений о несчастных случаях на рабочем месте.В материалах 43-й Европейской конференции по поиску информации (ECIR 2021)

Thy Thy Tran, Фонг Ле и София Ананиаду. 2020. Возвращаясь к неконтролируемому извлечению отношений. In Proceedings of the 58th Annual Conference of the Association for Computational Linguistics (ACL 2020) , pp. 7498-7505.

Пол Томпсон, Тим Йейтс, Эмра Инан и София Ананиаду. 2020. Семантическая аннотация для повышения безопасности строительных работ.In Proceedings of the 12th Language Resources and Evaluation Conference (LREC 2020) , pp. 1983 — 1992.

Chrysoula Zerva, Minh-Quoc Nghiem, Nhung T.H. Нгуен и София Ананиаду. 2020. Определение диапазона цитируемого текста для научного обобщения с использованием предварительно обученных кодировщиков. Наукометрия (2020) . https://doi.org/10.1007/s11192-020-03455-z.

Chrysoula Zerva, Minh-Quoc Nghiem, Nhung T.H. Нгуен и София Ананиаду, 2019. NaCTeM-UoM @ CL-SciSumm 2019. В материалах 4-го совместного семинара по библиометрическому поиску информации и обработке естественного языка для электронных библиотек (BIRNDL 2019) на SIGIR

Команда проекта

Главный исследователь: Проф. София Ананиаду

Исследователи: д-р Эмра Инан, д-р Мин-Куок Нгием, д-р Хрисула Зерва, д-р Фения Кристопулу, д-р Фонг Ле

Домашняя страница Stela Manova — Домашняя страница

Обо мне
Я лингвист с сильным математическим образованием.Меня интересуют структура и значение слов, фраз и предложений с теоретической, типологической и когнитивной точек зрения. Моя работа носит кросс-лингвистический характер, и я проводил исследования на белорусском, болгарском, чешском, английском, немецком, итальянском, польском, русском, сербском / хорватском / боснийском, словацком, словенском, испанском и украинском языках. Мои проекты были поддержаны такими учреждениями, как: Австрийский национальный банк (OeNB), Австрийский научный фонд (FWF), Erste Bank (DieErste) — Вена, Европейский научный фонд (ESF), мэр Вены и Венский университет.

Google Scholar
Research Gate
Academia


Научные интересы

  • Язык и познание
  • Теоретическая лингвистика / Моделирование языка / НЛП
  • Экспериментальная лингвистика
  • Вычислительная лингвистика
  • Корпоративная лингвистика
  • Статистика (SPSS и R)
  • Алгоритмы и структуры данных

Языки программирования: Java, Python, C ++, немного C, JavaScript, HTML и R, a.о.


Контакт


Текущее исследование (Последнее обновление: март 2019) Веду четыре проекта:

1) Что в морфеме? Теоретические, экспериментальные и вычислительные подходы к соотношению значения и формы в морфологии

(совместно с Харальдом Хаммарстремом, Уппсальский университет; Итамаром Кастнером, Берлинский университет Гумбольдта; и Йининг Не, Нью-Йоркский университет)
Мы готовим специальный выпуск журнала журнал Word Structure, Edinburgh University Press, с Грегом Стампом в качестве ответственного редактора журнала.

2) Славянская оценочная морфология (совместно с Дмитрием Ситчинавой, Институт русского языка им. Виноградова, Москва, и Марией Шведовой, Киевский национальный лингвистический университет)
Мы исследуем диминутивизацию с помощью электронных корпусов, а также происхождение и развитие уменьшительных в славянских языках. Основное внимание в проекте уделяется деривационным парадигмам.

3) Обработка структуры слова (совместно со Шпелой Медвешек и Робертой Чисич, Университет Любляны / Вены, и Джорджией Нелл, Венский университет)
Этот проект представляет собой психолингвистическое исследование того, как носители словенского и итальянского языков а также носители и не родные носители английского языка обрабатывают структуру слова, в частности, речь идет о роли структур, меньших, чем слова, и больших, чем морфемы, в языковой обработке.

4) Порядок аффиксов и структура слов
Книга о взаимосвязи между структурой слов и порядком аффиксов на славянских, германских и романских языках, будет опубликована в Oxford University Press. Я показываю, что слова напоминают числовые структуры в том смысле, что и слова, и числовые структуры являются шаблонными по своей природе, то есть позиционно организованными и могут иметь разные области, каждая со своими правилами / особенностями. Я также демонстрирую существование грамматических единиц, которые находятся между морфемами и словами, а также то, что эти единицы кодируют семантическое значение так же, как и слова.

Эти проекты являются частью более крупного проекта Порядок присоединения / разложения славянского слова , в сотрудничестве с Марком Аронофф (Университет Стони Брук).

На сайте Research Gate вы можете найти наши опубликованные исследования, а также следить за нашими обновлениями.

Помимо лингвистики, я люблю математику и программирование. Меня интересуют алгоритмы , структуры данных и языки программирования .

Новости июль 2021 г.
Рукопись Линейный порядок элементов в известных лингвистических последовательностях: получение порядков Tns-Asp-Mood и Universal 20 Гринберга с n-граммами теперь на lingbuzz: https: // lingbuzz.сеть / lingbuzz / 006082.

2nd CFP Рассекающая морфологическая теория 2: Диминутивизация в морфологе, основанном на корнях, основах и словах y, семинар будет проведен в связи с 46-й Австрийской лингвистической конференцией / 46. Österreichische Linguistiktagung (ÖLT) в Вене 11–12 декабря 2021 г. Срок подачи тезисов: 31 июль 2021 г. .

июнь 2021 г.
Семинар SLE 2021 Анализ морфологической теории 1: Диминутивизация по языкам и фреймворкам , расписание доступно ссылка.

«Ограничения на порядок между аффиксами» (глава из 15 слов на K) появится в The Wiley Blackwell Companion to Morphology , под редакцией Питера Акемы, Сабрины Бенджабалла, Эулалии Бонет и Антонио Фабрегаса.

май 2021 г.
Теперь доступен набор данных суффиксных комбинаций в испанском словообразовании, подготовленный в сотрудничестве с моей ученицей Марией Сильвой и Мигелем Ласаро (Complutense Madrid) .

Апрель 2021 г.
Приглашение внести свой вклад в раздел о значимости аффиксов / порядка слов для The Oxford Handbook of Iconicity in Language , под редакцией Ольги Фишер (Амстердам), Кими Акита (Нагоя) и Памелы Пернисс (Кельн ).

март 2021 г.
Комбинации из двух суффиксов в родном и неродном английском языках: новые доказательства морфомических структур, в Все вещи морфология: его независимость и интерфейсы сейчас находится в разработке. Ссылка на сайт издателя здесь .

Добро пожаловать к Марии Фернанде Сильве Азуа, которая присоединилась к моей лаборатории для проекта cogsci по морфологической обработке (порядок суффиксов в испанском словообразовании). Мария имеет степень в области латиноамериканского языка и литературы Национального автономного университета Мексики.

Январь 2021 г.
Оценщик Словацкого агентства исследований и разработок APVV.

Декабрь 2020 г.
Предложение семинара по SLE Рассмотрение морфологической теории 1: диминутивизация между языками и фреймворками было принято. Ссылка на описание WS на сайте SLE здесь.

Эксперт Словацкого агентства исследований и разработок APVV.

октябрь 2020 г.
CFP: Dissecting Morphological Theory 1: Diminutivization Across Languages ​​and Frameworks , Предложение о проведении семинара в связи с 54-м ежегодным собранием Societas Linguistica Europaea, Афины, 31 августа — 3 сентября 2021 г. .Крайний срок подачи тезисов: 8 ноября 2020 г. PDF CFP.

август 2020 г.
Рассечение морфологической теории 2: Диминутивизация в морфологии на основе корня, основы и слов (с Бобаном Арсеньевичем, Лаурой Грестенбергер и Катариной Корецки-Крелль) будет проводиться в связи с 46-й Австрийской лингвистической конференцией в декабре 2021. Благодарим всех, кто оформил тезисы. Статистика зарегистрированных тезисов ЗДЕСЬ.

июнь 2020
Приглашение к участию в статье на тему «Ограничения упорядочения между аффиксами» для Wiley Blackwell Companion to Morphology , под редакцией Питера Аккемы, Сабрины Бенджабалла, Эулалии Бонет и Антонио Фабрегаса.

Оценщик этапа I оценки исследовательской и профессиональной деятельности научно-исследовательских институтов Чешской академии наук за период 2015–2019 гг.

UW Магистр компьютерной лингвистики

Компьютерные лингвисты помогают машинам обрабатывать человеческий язык. Все новаторские языковые технологии, используемые сегодня — поисковые системы, интеллектуальный обмен текстовыми сообщениями, распознавание речи, машинный перевод и голосовые пользовательские интерфейсы — полагаются на работу компьютерных лингвистов.

Станьте лидером в этой динамичной области, получив степень магистра компьютерной лингвистики в Вашингтонском университете.

Работа в новейших технологиях

Приготовьтесь к увлекательной карьере. Вычислительные лингвисты востребованы в быстро развивающихся областях, таких как искусственный интеллект и машинное обучение.

Откройте для себя карьеру

Получить уникальные знания

Наша программа — одна из немногих, которая сочетает в себе изучение лингвистики и обработки естественного языка, что дает вам уникальную глубину понимания и набор навыков для вашей карьеры.

Ознакомиться с курсами

Получите ценный опыт

Получите практический опыт, пройдя строгие стажировки в рамках программы.Наши студенты стажировались в некоторых ведущих мировых компаниях, включая Amazon и Google.

Узнайте о стажировках

Наслаждайтесь гибким обучением

С помощью нашей гибкой программы вы можете выбрать расписание и формат, которые лучше всего подходят для вас. Учитесь неполный или полный рабочий день, посещайте занятия онлайн или в кампусе, или и то, и другое.

Формат просмотра

Лаборатория компьютерной лингвистики | Корнельский университет

Проекты

Студенты и преподаватели в настоящее время работают над различными проектами в области вычислительной фонетики, фонологии, синтаксиса и семантики.

Нейролингвистика и психолингвистика

Джон Хейл • Шохини Бхаттасали • Джиксин Ли

Используя различные модели компьютерной лингвистики, мы изучаем когнитивную нейробиологию языка.Используя данные натуралистического понимания речи из исследований фМРТ, мы исследуем различные лингвистические вопросы, такие как сравнение композиционного значения с застывшим значением, семантическая согласованность и несогласованность, теория связывания и разрешение местоимений среди других тем.

Обобщенное обучение

Джейкоб Коллард • Джон Хейл • Матс Рут

Этот проект исследует обучаемость различных синтаксических формализмов, таких как категориальные грамматики и грамматики зависимостей, и пытается предоставить более натуралистический алгоритм для изучения синтаксиса, который не полагается на широко аннотированные структуры, а скорее на выводы, которые могут быть сделаны на основе базовых знаний.Мы также изучаем, как изученные грамматики сравниваются с разработанными грамматиками и утверждениями, сформулированными в теоретическом синтаксисе.

Фонология с конечным числом состояний

Матс Рут • Симоне Хармат-де-Лемос • Шохини Бхаттасали

В этом проекте мы обучаем модель конечного состояния для обнаружения просодических сигналов в корпусе речи.Мы особенно заинтересованы в обнаружении стрессовых сигналов в бразильском португальском и бенгальском языках и в поиске эмпирических доказательств текущих теоретических взглядов.

Последние публикации

Вот некоторые избранные публикации из последних работ преподавателей и аспирантов:

  • Кори Шайн, Идан Бланк, Мартен ван Шейндел , Уильям Шулер и Эвелина Федоренко.(2020) ФМРТ выявляет специфичное для языка прогностическое кодирование во время естественного понимания предложений. Neuropsychologia, 138: 107307. 2020

  • Форрест Дэвис и Мартен ван Шейндел. (2020) Рекуррентные языковые модели нейронных сетей всегда изучают присоединение относительных предложений, аналогичное английскому. Труды Ежегодной конференции 2020 Ассоциации компьютерной лингвистики (ACL). 2020.

  • Форрест Дэвис и Мартен ван Шейндел . (2020) Структура дискурса взаимодействует со ссылкой, но не с синтаксисом в нейронных языковых моделях. 24-я конференция по компьютерному изучению естественного языка (CoNLL).2020.

  • Дебасмита Бхаттачарья и Мартен ван Схейндел . (2020) Заполнители пробелов, которые нейронные сети не могут обобщить. 24-я конференция по компьютерному изучению естественного языка (CoNLL). 2020.

  • Форрест Дэвис и Мартен ван Шейндел. (2020) Взаимодействие с контекстом во время обработки повторяющихся предложений нейронной сети. Труды 42-го ежегодного виртуального собрания Общества когнитивных наук (CogSci). 2020.

  • Мартен ван Схейндел , Аарон Мюллер и Таль Линзен. (2019) Количество не покупается на качественный синтаксис с нейронными языковыми моделями. Материалы конференции 2019 года по эмпирическим методам обработки естественного языка и 9-й Международной совместной конференции по обработке естественного языка (EMNLP-IJCAI). 2019.

  • Груша Прасад, Мартен ван Шейндел и Таль Линзен. (2019) Использование прайминга для раскрытия организации синтаксических представлений в моделях нейронного языка. Материалы конференции 2019 года по компьютерному изучению естественного языка (CoNLL). 2019.

  • Форрест Дэвис и Эбби Кон. (2019) Влияние лексической частоты и композиционности на фонологическую редукцию в английских соединениях. 25-я конференция по архитектуре и механизмам обработки языков (AMLaP 2019)

  • Джейкоб Коллард .(2018) Рассуждение с помощью конечных состояний для удовлетворения предположений. Труды Первого международного семинара по языковому познанию и вычислительным моделям (COLING 2018) .

  • Шохини Бхаттасали , Мюриэль Фабр, Джон Хейл . (2018) Обработка MWE: нейрокогнитивные основы вербальных MWE и лексическая связность внутри MWE. Труды 14-го семинара по многословным выражениям (COLING 2018) .

  • Симона Хармат-де-Лемос . (2018) Что автоматическое распознавание речи может рассказать нам о стрессе и сдвиге напряжения в непрерывной речи. Труды 9-й Международной конференции по речевой словесности 2018 .

  • Цзиксин Ли , Мюриэль Фабр, Вен-Мин Лух, Джон Хейл . (2018) Моделирование мозговой активности, связанной с разрешением местоимений на английском и китайском языках. Труды семинара NAACL по вычислительным моделям эталона, анафоры и кореференции (CRAC 2018) .

  • Джейкоб Коллар. (2018) Алгоритм обучения натуралистическим выводом. Лингвистическое общество Америки (LSA 2018) .

  • Шохини Бхаттасали, Джон Хейл , Кристоф Паллиер, Джонатан Р. Бреннан, Вен-Мин Лух, Р. Натан Спренг. (2018) Дифференциация синтаксического анализа структуры фраз и извлечения памяти в мозге. Труды Общества вычислений в лингвистике (SCiL 2018) .

  • Коврики Рут . (2017) Конечная интенсиональная семантика. 12-я Международная конференция по вычислительной семантике (IWCS 2017) .

  • Мэтью Нельсон, Имен Эль Каруи, Кристоф Гибер, Сяофанг Янг, Лоран Коэн, Хильда Купман, Сидней С. Кэш, Лайонел Наккаш, Джон Хейл, , Кристоф Паллиер, Станислас Дехон.(2017) Нейрофизиологическая динамика построения фразеологической структуры при обработке предложений. Труды Национальной академии наук .

  • Мэтью Нельсон, Станислас Дехаэн, Кристоф Паллье и Джон Хейл . (2017). Уменьшение энтропии коррелирует с активностью височной доли. Труды 7-го семинара по когнитивному моделированию и компьютерной лингвистике (CMCL 2017) .

  • Джейкоб Коллард . (2016) Определение необходимых категорий в CCG. 9-я Международная конференция по логическим аспектам компьютерной лингвистики (LACL 2016) .

  • Джонатан Хауэлл, Матс Рут и Майкл Вагнер. (2016). Акустическая классификация по фокусу: в сети и в лаборатории.Doi 1813/42538

  • Джонатан Р. Бреннан, Эдвард П. Стэблер, Сара Э. Ван Вагенен, Вен-Минг Лух и Джон Т. Хейл . (2016) Абстрактная языковая структура коррелирует с временной активностью во время естественного понимания. Мозг и язык 157 , 81-94.

  • Джон Хейл . (2016). Метрики теоретико-информационной сложности.» Язык и лингвистический компас

  • Цзиксин Ли , Джонатан Бреннан, Адам Махар и Джон Хейл . (2016). Височные доли как комбинаторные двигатели формы и значения. Труды семинара по компьютерной лингвистике для языковой сложности (CL4LC 2016) .

  • Джон Т. Хейл , Дэвид Э. Лутц , Венминг Лух и Джонатан Р. Бреннан. (2015). Моделирование временных курсов фМРТ с лингвистической структурой с различным размером зерна. Протоколы CMCL 2015 .

  • Шохини Бхаттасали , Джереми Ситрин, Элана Фельдман и Пак Джунсук.(2015). Автоматическое определение риторических вопросов. Материалы 53-го ежегодного собрания Ассоциации компьютерной лингвистики (ACL 2015) .

Недавние курсы:

Если вас интересует компьютерная лингвистика, эти классы — отличный способ начать работу в этой области:

LING 4424: Компьютерная лингвистика

Введение в компьютерную лингвистику.Возможные темы включают синтаксический анализ с использованием функционального программирования, вычислительной семантики на основе логики и конечного состояния моделирование фонологии и фонетики.

LING 4434: Компьютерная лингвистика 2

Компьютерная лингвистика 2 — Этот курс знакомит с методами исследования лингвистических представлений в нейросетевых моделях языка.В центре обсуждения текущих исследовательских работ, а также исследовательских проектов студентов.

ЛИНГ 4429/6429: Грамматические формализмы

Этот курс знакомит с различными способами «формализации» лингвистического анализа с примеры из синтаксиса естественного языка. Студенты учатся определять повторяющиеся темы в генеративной грамматики, видя, как альтернативные концептуализации приводят к разным аналитическим компромиссы.Использование различий, таких как правило против ограничения, трансформационный против моностратального и нарушаемость vs. неприкосновенность, учащиеся становятся лучше способны оценивать работу других в различных сферах. формализмов и лучше умеют применять формализм в собственном анализе.

LING 4485/6485: Темы компьютерной лингвистики

Актуальные темы компьютерной лингвистики.Последние темы включают вычислительные модели для теории оптимальности и моделей с конечным числом состояний.

ЛИНГ 2264: Язык, разум и мозг

Введение в нейролингвистику, этот курс исследует такие темы, как афазия, латерализация полушария и понимание речи при их изучении с помощью нейровизуализации, внутричерепная запись и другие методы.

Добавить комментарий

Ваш адрес email не будет опубликован. Обязательные поля помечены *