Дериватная группа

Основным понятием словаря является дериватная группа - это множество однокоренных слов разных частей речи, близких по смыслу. Слова задаются в нормальной форме (лемме) - для существительных это именительный падеж единственное число, для прилагательных и причастий ещё и мужской род, для глаголов инфинитив. Также слова могут иметь набор атрибутов, списки которых зависят от частей речи слов.
Между группами задаются связи, которые могут быть разных типов. Между двумя группами возможна только одна связь какого-либо типа (список таких типов находится на стадии согласования). Связи между разноязычными группами могут быть только типа "перевод".
Группа может содержать модель управления, которая содержащит информацию о возможных семантико-семантических связях на основе падежно-предложных данных. Модель состоит из базовой части, связанной с пятью падежными вопросами к определённым типам слов, и основной части из данных, относящихся ко всем словам группы.

Связи между группами

В дериватном словаре связи устанавливаются не между отдельными словами, а между группами. Предлагаются следующие типы связей:

Тип связиЗначение JsonКраткое описание
АссоциацияassocПроизвольная связь (свободная ассоциация)
СинонимsynОднозначная синонимия (иначе - ассоциация)
Общее-частноеgenpartОт более общего понятия к частному
Частное-общееpartgenОт более частного понятия к более общему
ПротивоположностиopposОбозначают противоположные понятия
Часть-целоеpartwholeОт части к целому
Целое-частьwholepartОт целого к части
Минус префиксprefminusИсходная группа получена с помощью приставки
Плюс префиксprefplusЦелевая группа получается с помощью приставки
Несовершенная форма глаголаtoimperfВ целевой группе находится несовершенная форма глагола (СДЕЛАТЬ -> ДЕЛАТЬ)
Совершенная форма глаголаtoperfВ целевой группе находится совершенная форма глагола (ДЕЛАТЬ -> СДЕЛАТЬ)
ПереводtranslСсылка на группу другого языка

Атрибуты и параметры группы

Для группы установлен язык (RU, EN или UA), который нельзя изменить.
Группа может иметь атрибут "мат" и "переходность" (если содержит глагол переходного типа).
Группа имеет дату-время своей последней модификации. При желании можно посмотреть всю историю: кто, когда и что изменял в данной группе.

Слова группы

Слово в группе имеет тип, лемму и некоторое количество атрибутов. Поддерживаются следующие типы:

ТипЗначение Json
Существительноеnoun
Прилагательноеadj
Наречиеadverb
Глаголverb
Причастиеpart
Деепричастиеadpart

Лемма - это нормальная форма словоформ: для существительных - именительный падеж единственное число, для прилагательных и причастий ещё и мужской род, для глаголов - инфинитив.
Атрибуты у слова могут быть следующие:
АтрибутЗначение JsonВозможные типыПримеры
Сленгslangвсежратва, глазеть
Позитивноеpositiveвсеотличный, красота
Негативноеnegativeвсехреновый, убийство
Превосходная степеньsuperlativeсущ. прилаг. высочайший, громадище
Уменьшительно-ласкательноеdiminutiveсущ. прилаг. ребеночек, ножка
Пренебрежительноеdismissiveсущ. прилаг. училка, дырень
Отглаголиваемоеnounverbсущ. работа->работать, служение->служить
Концептconceptсущ. материализм, абстрактность
Одушевленноеanimatedсущ. комар, рыбка
Человекhumanсущ. учитель, пациент
Мужскоеmaleсущ. дурень, мистер, бык
Женскоеfemaleсущ. доярка, королева, корова
Детскоеchildсущ. внучка, львёнок
Имяnameсущ. Василий, Гоша, Костян
Географический объектgeoсущ. Москва, Америка, Кавказ
Персона за словомpersonafterсущ. адвокат, охранник, слуга
Страдательный залогpassiveприч. открытый, купленный
Прошедшее времяpasttenseприч. открываемый, покупаемый
Совершенная формаperfectiveглаг. прич. дееприч. сделать, купивший
Возвратная формаreflexiveглаг. прич. дееприч. сделаться, купившийся

Текущее состояние Словаря

То, что здесь описано, далеко не всё сейчас реализовано в Словаре. Например, нет многих атрибутов. Из связей есть только "приставочное образование", а "перевод" получен автоматически. Группы на английском и украинском языках получены через автоматический перевод слов групп русского языка, поэтому всё должно быть вручную проверено и откорректировано.
Да и к группам русского языка много нареканий. Словарь составлялся и корректировался разными людьми в разное время - необходимо проверить и подправить имеющиеся группы. Некоторые из них нужно расщепить. Например, сейчас "УЧИТЬ" и "УЧИТЬСЯ" в одной группе, соответственно там и "УЧИТЕЛЬ", и "УЧЕНИК" и пр. слова. Хотя они от одного корня, но несут совершенно разный смысл. Да и перевод у них разных на английский, что тоже мотив для расщепления. И наоборот, некоторые группы нужно объединять. Расставить для слов новые атрибуты, подправить модели управления и прочее.

Модель управления

Моделью управления (МУ) мы называем информацию о возможных предложно-падежных связях с другими словами. Причём основная часть таких связей относится обычно сразу ко всем словам группы (пока игнорируем исключения, возможно, в будущем придётся эту модель корректировать). Каждая связь - это фактически вопрос типа "кто/что?", "что делать?", "от кого/чего" и т.д.
Базовая часть МУ состоит из ответов на 5 вопросов: "кто/что" (именит.падеж), "кого/чего" (родит.), "кого/что" (винит.), "кем/чем" (творит.), "кому/чему" (дат.). Фигурантом ответа может выступать объект в одной из семантических ролей: агенс (объект действия) и/или пациенс (субъект действия). А роль в свою очередь зависит от одного из трёх типов слов: (1) невозвратные глагол, деепричастие или нестрадательное причастие, (2) возвратные глагол или страдательное причастие и (3) отглаголиваемое существительное. В общем случае имеет место следующая таблица на примере группы "ОТНЕСЕНИЕ":

ВопросПрямые глаголыВозвратн. и страдат.Отгл.существ.
Примерыотнести относить отнестись относиться отнесение
кто/чтоагенспациенс 
кого/чего  пациенса
кого/чтопациенса  
кем/чем агенсомагенсом
кому/чему   

По этой табличке семантически эквивалентны:
  • агенс относит пациенса
  • пациенс относится агенсом
  • отнесение пациенса агенсом
Это довольно типовая ситуация для групп с переходными глаголами, хотя и встречаются расхождения. Например, у слова "управляться" для вопроса "кто/что" роли могут быть как агенса, так и пациенса. Для групп непереходных глаголов ситуация в каждом случае может быть своей.
Остальные вопросы считаем общей частью МУ - они относятся сразу ко всем словам без дифференциации. Здесь связь задаётся вопросом и возможным признаком "сильная связь". Вопросы делятся на общие и конкретные. Конкретные вопросы могут относиться к общему вопросу (например, "на ком/чём" или "у кого/чего" в общий "где?"). Вот суммарная табличка вопросов на текущий момент:
Вопрос (RU)Вопрос UAТип
что делатьщо робитиконкретика для "что делать"
гдедеобщий
кудакудиобщий
откудазвідкиобщий
когдаколиобщий
без чегобез чого
в чтов щоконкретика для "куда"
в чёмв щоконкретика для "где"
ввиду чего 
вдоль чегоуздовж чогоконкретика для "где"
взамен чегозамість чого
включая чтовключаючи що
вместо чегозамість чого
вне чегопоза чогоконкретика для "где"
вокруг чегонавколо чогоконкретика для "где"
вопреки чемувсупереч чому
вследствие чеговнаслідок чого
для чегодля чого
до чегодо чогоконкретика для "куда"
за чтоза що
за чемза чимконкретика для "где"
из чегоз чогоконкретика для "откуда"
изза чего 
изнутри чегозсередини чогоконкретика для "откуда"
к чемудо чомуконкретика для "куда"
между чемпоміж чимконкретика для "где"
на чтона щоконкретика для "куда"
на чёмна щоконкретика для "где"
навстречу чемуназустріч чомуконкретика для "куда"
над чемнад чимконкретика для "где"
о чтопро що
о чёмпро що
от чеговід чогоконкретика для "откуда"
перед чемперед чимконкретика для "где"
по чемуз чому
по чтоза щоконкретика для "куда"
по чёмпо що
под чтопід щоконкретика для "где"
под чемпід чимконкретика для "где"
посредством чегоза допомогою чого
при чёмпри щоконкретика для "где"
про чтопро що
против чегопроти чого
ради чегозаради чого
с чегоз чогоконкретика для "откуда"
с чемз чим
сквозь чтокрізь щоконкретика для "где"
согласно чемузгідно чому
соответственно чемувідповідно чому
соразмерно чемупропорційно чому
среди чегопоміж чогоконкретика для "где"
у чегобіля чогоконкретика для "где"
через чточерез щоконкретика для "где"