Дериватная группа
Основным понятием словаря является дериватная группа - это множество
однокоренных слов разных частей речи, близких по смыслу.
Слова задаются в нормальной форме (лемме) - для существительных это именительный падеж
единственное число, для прилагательных и причастий ещё и мужской род, для глаголов инфинитив.
Также слова могут иметь набор атрибутов, списки которых зависят от частей речи слов.
Между группами задаются связи, которые могут быть разных типов.
Между двумя группами возможна только одна связь какого-либо типа
(список таких типов находится на стадии согласования).
Связи между разноязычными группами могут быть только типа "перевод".
Группа может содержать модель управления, которая содержащит информацию о
возможных семантико-семантических связях на основе падежно-предложных данных.
Модель состоит из базовой части, связанной с пятью падежными вопросами к
определённым типам слов, и основной части из данных, относящихся ко всем словам группы.
Связи между группами
В дериватном словаре связи устанавливаются не между отдельными словами, а между группами.
Предлагаются следующие типы связей:
Тип связи | Значение Json | Краткое описание |
---|---|---|
Ассоциация | assoc | Произвольная связь (свободная ассоциация) |
Синоним | syn | Однозначная синонимия (иначе - ассоциация) |
Общее-частное | genpart | От более общего понятия к частному |
Частное-общее | partgen | От более частного понятия к более общему |
Противоположности | oppos | Обозначают противоположные понятия |
Часть-целое | partwhole | От части к целому |
Целое-часть | wholepart | От целого к части |
Минус префикс | prefminus | Исходная группа получена с помощью приставки |
Плюс префикс | prefplus | Целевая группа получается с помощью приставки |
Несовершенная форма глагола | toimperf | В целевой группе находится несовершенная форма глагола (СДЕЛАТЬ -> ДЕЛАТЬ) |
Совершенная форма глагола | toperf | В целевой группе находится совершенная форма глагола (ДЕЛАТЬ -> СДЕЛАТЬ) |
Перевод | transl | Ссылка на группу другого языка |
Атрибуты и параметры группы
Для группы установлен язык (RU, EN или UA), который нельзя изменить.
Группа может иметь атрибут "мат" и "переходность" (если содержит глагол переходного типа).
Группа имеет дату-время своей последней модификации. При желании можно
посмотреть всю историю: кто, когда и что изменял в данной группе.
Слова группы
Слово в группе имеет тип, лемму и некоторое количество атрибутов. Поддерживаются следующие типы:
Тип | Значение Json |
---|---|
Существительное | noun |
Прилагательное | adj |
Наречие | adverb |
Глагол | verb |
Причастие | part |
Деепричастие | adpart |
Атрибут | Значение Json | Возможные типы | Примеры |
---|---|---|---|
Сленг | slang | все | жратва, глазеть |
Позитивное | positive | все | отличный, красота |
Негативное | negative | все | хреновый, убийство |
Превосходная степень | superlative | сущ. прилаг. | высочайший, громадище |
Уменьшительно-ласкательное | diminutive | сущ. прилаг. | ребеночек, ножка |
Пренебрежительное | dismissive | сущ. прилаг. | училка, дырень |
Отглаголиваемое | nounverb | сущ. | работа->работать, служение->служить |
Концепт | concept | сущ. | материализм, абстрактность |
Одушевленное | animated | сущ. | комар, рыбка |
Человек | human | сущ. | учитель, пациент |
Мужское | male | сущ. | дурень, мистер, бык |
Женское | female | сущ. | доярка, королева, корова |
Детское | child | сущ. | внучка, львёнок |
Имя | name | сущ. | Василий, Гоша, Костян |
Географический объект | geo | сущ. | Москва, Америка, Кавказ |
Персона за словом | personafter | сущ. | адвокат, охранник, слуга |
Страдательный залог | passive | прич. | открытый, купленный |
Прошедшее время | pasttense | прич. | открываемый, покупаемый |
Совершенная форма | perfective | глаг. прич. дееприч. | сделать, купивший |
Возвратная форма | reflexive | глаг. прич. дееприч. | сделаться, купившийся |
Текущее состояние Словаря
То, что здесь описано, далеко не всё сейчас реализовано в Словаре.
Например, нет многих атрибутов. Из связей есть только "приставочное образование",
а "перевод" получен автоматически. Группы на английском и украинском языках получены
через автоматический перевод слов групп русского языка, поэтому всё должно быть
вручную проверено и откорректировано.
Да и к группам русского языка много нареканий. Словарь составлялся и корректировался
разными людьми в разное время - необходимо проверить и подправить имеющиеся группы.
Некоторые из них нужно расщепить. Например, сейчас "УЧИТЬ" и "УЧИТЬСЯ" в одной группе,
соответственно там и "УЧИТЕЛЬ", и "УЧЕНИК" и пр. слова. Хотя они от одного корня, но
несут совершенно разный смысл. Да и перевод у них разных на английский, что тоже
мотив для расщепления. И наоборот, некоторые группы нужно объединять.
Расставить для слов новые атрибуты, подправить модели управления и прочее.
Модель управления
Моделью управления (МУ) мы называем информацию о возможных предложно-падежных связях с другими словами.
Причём основная часть таких связей относится обычно сразу ко всем словам группы
(пока игнорируем исключения, возможно, в будущем придётся эту модель корректировать).
Каждая связь - это фактически вопрос типа "кто/что?", "что делать?", "от кого/чего" и т.д.
Базовая часть МУ состоит из ответов на 5 вопросов: "кто/что" (именит.падеж), "кого/чего" (родит.),
"кого/что" (винит.), "кем/чем" (творит.), "кому/чему" (дат.). Фигурантом ответа может выступать объект в одной из семантических ролей:
агенс (объект действия) и/или пациенс (субъект действия). А роль в свою очередь зависит от одного из трёх типов слов:
(1) невозвратные глагол, деепричастие или нестрадательное причастие, (2) возвратные глагол или страдательное причастие
и (3) отглаголиваемое существительное. В общем случае имеет место следующая таблица на примере группы "ОТНЕСЕНИЕ":
Вопрос | Прямые глаголы | Возвратн. и страдат. | Отгл.существ. |
---|---|---|---|
Примеры | отнести относить | отнестись относиться | отнесение |
кто/что | агенс | пациенс | |
кого/чего | пациенса | ||
кого/что | пациенса | ||
кем/чем | агенсом | агенсом | |
кому/чему |
Вопрос (RU) | Вопрос UA | Тип |
---|---|---|
что делать | що робити | конкретика для "что делать" |
где | де | общий |
куда | куди | общий |
откуда | звідки | общий |
когда | коли | общий |
без чего | без чого | |
в что | в що | конкретика для "куда" |
в чём | в що | конкретика для "где" |
ввиду чего | ||
вдоль чего | уздовж чого | конкретика для "где" |
взамен чего | замість чого | |
включая что | включаючи що | |
вместо чего | замість чого | |
вне чего | поза чого | конкретика для "где" |
вокруг чего | навколо чого | конкретика для "где" |
вопреки чему | всупереч чому | |
вследствие чего | внаслідок чого | |
для чего | для чого | |
до чего | до чого | конкретика для "куда" |
за что | за що | |
за чем | за чим | конкретика для "где" |
из чего | з чого | конкретика для "откуда" |
изза чего | ||
изнутри чего | зсередини чого | конкретика для "откуда" |
к чему | до чому | конкретика для "куда" |
между чем | поміж чим | конкретика для "где" |
на что | на що | конкретика для "куда" |
на чём | на що | конкретика для "где" |
навстречу чему | назустріч чому | конкретика для "куда" |
над чем | над чим | конкретика для "где" |
о что | про що | |
о чём | про що | |
от чего | від чого | конкретика для "откуда" |
перед чем | перед чим | конкретика для "где" |
по чему | з чому | |
по что | за що | конкретика для "куда" |
по чём | по що | |
под что | під що | конкретика для "где" |
под чем | під чим | конкретика для "где" |
посредством чего | за допомогою чого | |
при чём | при що | конкретика для "где" |
про что | про що | |
против чего | проти чого | |
ради чего | заради чого | |
с чего | з чого | конкретика для "откуда" |
с чем | з чим | |
сквозь что | крізь що | конкретика для "где" |
согласно чему | згідно чому | |
соответственно чему | відповідно чому | |
соразмерно чему | пропорційно чому | |
среди чего | поміж чого | конкретика для "где" |
у чего | біля чого | конкретика для "где" |
через что | через що | конкретика для "где" |