Skip to content
View DanilaAniva's full-sized avatar

Block or report DanilaAniva

Block user

Prevent this user from interacting with your repositories and sending you notifications. Learn more about blocking users.

You must be logged in to block users.

Maximum 250 characters. Please don't include any personal information such as legal names or email addresses. Markdown supported. This note will be visible to only you.
Report abuse

Contact GitHub support about this user’s behavior. Learn more about reporting abuse.

Report abuse
DanilaAniva/README.md
Banner

Привет! Меня зовут Данила 👋
🌇 Живу в Москве
🔥 ML Engineer / Data Scientist. Занимаюсь разработкой и деплоем решений в области CV, NLP и Audio. Активный участник хакатонов (LCT, Transneft).

💡 Забавный факт: "Не оцениваю результаты генеративки глазами, а провожу Human Evaluation."

Связаться со мной:
🍊 Обязательно пиши в ТГ, если хочешь что-то спросить, предложить или просто пообщаться — @LichPlease


🚀 Избранные проекты


Сервис автоматизации голосовых отчетов.
🥇 1-е место Хакатон Транснефть · Whisper-large-v3 · Local LLM (Vikhr)
Backend на FastAPI для преобразования голосовых заметок в структурированные DOCX-документы. Пайплайн состоит из Whisper (ASR) для транскрибации и Vikhr-Nemo-12B (LLM) для извлечения именованных сущностей (NER) и форматирования задач.

DiaBERT Preview


Система компьютерного зрения для сверки промышленного инструмента.
🏅 LCT 2025 Moscow · Triton Inference Server · Foundational Models
Приложение для проверки комплектности наборов инструментов по фото. Использует связку YOLOv11 для детекции объектов и DinoV3 для извлечения визуальных признаков (embeddings). Деплой реализован через Nvidia Triton для минимизации задержек (Latency).

KitMatch Preview


Семантический поиск по видео (Video/Audio/Text).
🏅 LCT 2024 (Yappy) · Hybrid Search · Jina-CLIP
Решение проблемы поиска видео без метаданных. Индексация происходит по трем модальностям:

  1. Visual: Jina-CLIP (эмбеддинги видеоряда с контекстом 8k).
  2. Audio: Nvidia NeMo FastConformer (распознавание речи).
  3. Text: EasyOCR (считывание титров и текста в кадре).

Video Search Preview


Платформа сегментации медицинских снимков.
🔬 Segmentation · Custom UNet++ · EfficientNet Encoder
Сервис для анализа рентгеновских снимков (формат DICOM). Реализован полный цикл обучения с использованием DiceBCELoss и кастомных шедулеров. В пайплайн встроен Autoencoder для предварительной фильтрации аномалий и невалидных изображений.

Med Service Preview


Утилита маскирования персональных данных (PII).
🔒 Data Security · NLP Patterns · PostgreSQL
Инструмент для обезличивания дампов баз данных. Автоматически детектирует и скрывает чувствительные данные (номера карт, ИНН, ФИО), используя комбинацию регулярных выражений и NLP-эвристик. Поддерживает работу через ORM Peewee.

DataMasking — график распределения данных


Pinned Loading

  1. AI-med-service AI-med-service Public

    Forked from VadimKirillov/AI-med-service

    Медицинский сервис с функциями сегментации, классификации по изображениям с использованием U-NET, U-NET++

    Jupyter Notebook

  2. DiabertASRBackend DiabertASRBackend Public

    This repository contains a structured implementation of a FASTAPI application for speech recognition and audio analysis, using Whisper and LLM Vikrh-12B-Nemo

    Python 1

  3. DataMasking DataMasking Public

    Маскирование персональных данных (банковских номеров, номеров кредитной карты, ИНН, имен и др) с примером для PostgreSQL + ORM Peewee.

    Python 5

  4. kitmatch kitmatch Public

    Unique tool matching app that makes you happy when you see bbox on every tool; Triton+FastAPI deplyoment; Yolov11, DinoV3 experiments; React frontend.

    Jupyter Notebook