Бот основанный на кодировке слов с помощью CountVectorizer и сходства текстов с помощью косинусного расстояния Принцип очень простой: пользователь отправляет сообщение , мы его чистим от знаков препинания и приводим к нижнему регистру с помощью обученного CountVectorizer на тренировочных вопросах мы кодируем вопрос пользователя и затем просто проходимся по массиву вопросов которые у нас есть, считаем косинусные расстояния и выдаем ответ соответствующий вопросу который имеет самое большое косинусное расстояние с вопросом пользователя. Конечно этот способ очень спорный т.к. слова с разными окончаниями будут восприниматься как разные и еще несколько проблем есть,но всё же для первого раза думаю пойдет.
Дальше больше:)