Skip to content

Jey-37/sum20

Repository files navigation

Словник української мови у 20 томах (СУМ-20)

Вітаю!

Оскільки я ніде не знайшов український тлумачний словник у форматі вільних даних (та й узагалі, фактично є лише одна електронна повна версія словника, і те вкрай повільна), то рішив спарсити його сам. Структура досить проста й зрозуміла, тому гадаю не буде проблем розібратися, що до чого. Наразі доступно 15 томів (А-П'ЯТЬ). Поділ на файли не має чіткої відповідности томам, проте слова йдуть у правильному порядку.

Початково мав намір також спарсити решту слів із СУМ-11, проте єдина (знову таки) електронна версія цього словника надто погано розмічена, тому парсинг виявився практично неможливим.

Поки не певен, де саме цьому можна знайти застосування, втім вважаю, що будь-які мовознавчі знадоби (звісно не захищені авторським правом) мають бути загальноприступні в зручному форматі.

Буду радий якщо комусь знадобиться!

Слава Україні! Героям слава!

About

Словник української мови у 20 томах у форматі JSON

Topics

Resources

Stars

Watchers

Forks

Releases

No releases published

Packages

No packages published