Development #1

grishchenkoira · 2023-10-07T21:10:37Z

This pull request adds a utility Bio_Seq_Analysis_Tool.py with 3 main functions, a folder with 3 modules required for Bio_Seq_Analysis_Tool and README.md file

… of this one

albidgy

Плюсы:

Молодец, что добавила в README примеры, что вернется если подать такую-то последовательность.
Код, который ты пишешь, работает правильно.
Докстринги и typing сделаны правильно и подробно. Здорово!

Замечания:

Не забывай ставить пробелы.
Не включила границы в fastq_analysis.
Не нужно системные файлы добавлять на GitHub, это плохая практика. Ты добавила директорию .ipynb_checkpoints.
Вот совсем непонятно, что было сделано за тот или иной коммит. Хочется более конкретных комментариев, что было добавлено/сделано.

- У тебя достаточно тяжело воспринимаемый код получается. Это сейчас не страшно, но над этим нужно работать. У меня есть 2 предложения:

Когда ты написала какую-то функцию, пробуй придумать, как можно убрать повторяющиеся части кода (если они есть).
Можно, думаю, смотреть прошлые домашние задания одногруппников. Мы там указываем на преимущества и недостатки. Анализируй код, почему он тебе нравится или не нравится.

Баллы:

3 фильтрации FASTQ 3/3
Главная функция 0.9/1 (границы значений не включены)
README 2/2
Структура репозитория и качество кода 2/3 (-0.5 за системные файлы, -0.3 за комментарии к коммитам, -0.2 Отсутствие пробелов).
Улучшение кода ДНК/РНК и белковых тулов 0.8/1.

Итого: 8.7 баллов

albidgy · 2023-10-16T09:20:29Z

modules_for_BSAT/dna_rna_analysis.py

+    :rtype: str
+    :return: complement sequence   
+    """
+    complement_dict = {'A': 'T', 'C': 'G', 


Про словарь я тебе писала, что его лучше сделать константой и вынести за пределы функции.

albidgy · 2023-10-16T09:20:30Z

modules_for_BSAT/dna_rna_analysis.py

+    complement_dict = {'A': 'T', 'C': 'G', 
+                   'G': 'C', 'T': 'A', 'U': 'A', 'a': 't',
+                   'c': 'g', 'g': 'c', 't': 'a', 'u': 'a'}
+    complement_seq = []


За это спасибо!

albidgy · 2023-10-16T09:20:31Z

modules_for_BSAT/dna_rna_analysis.py

+    :return: GC-contentn percent 
+    """
+    length = len(seq)
+    gc_content = 0.0


Можно не создавать переменную, она сама создастся на лету в строке 78

albidgy · 2023-10-16T09:20:34Z

modules_for_BSAT/dna_rna_analysis.py

+    length = len(seq)
+    gc_content = 0.0
+    seq_up = seq.upper()
+    c = seq_up.count("C")


Раньше было лучше название - c_nucl

albidgy · 2023-10-16T09:20:36Z

modules_for_BSAT/dna_rna_analysis.py

+    seq_up = seq.upper()
+    c = seq_up.count("C")
+    g = seq_up.count("G")
+    gc_content = round(((c+g)/length*100),2)


Не забывай про пробелы. + одна пара скобок тут лишняя.

Suggested change

gc_content = round(((c+g)/length*100),2)

gc_content = round((c+g) / length * 100 , 2)

albidgy · 2023-10-16T09:20:54Z