Skip to content

richlukich/EzChatBot

Repository files navigation

EzChatBot

Бот основанный на кодировке слов с помощью CountVectorizer и сходства текстов с помощью косинусного расстояния Принцип очень простой: пользователь отправляет сообщение , мы его чистим от знаков препинания и приводим к нижнему регистру с помощью обученного CountVectorizer на тренировочных вопросах мы кодируем вопрос пользователя и затем просто проходимся по массиву вопросов которые у нас есть, считаем косинусные расстояния и выдаем ответ соответствующий вопросу который имеет самое большое косинусное расстояние с вопросом пользователя. Конечно этот способ очень спорный т.к. слова с разными окончаниями будут восприниматься как разные и еще несколько проблем есть,но всё же для первого раза думаю пойдет.

Дальше больше:)

About

No description, website, or topics provided.

Resources

Stars

Watchers

Forks

Releases

No releases published

Packages

No packages published

Languages