Skip to content

Hw6 Feedback#2

Open
ArtemVaska wants to merge 49 commits intomainfrom
hw6
Open

Hw6 Feedback#2
ArtemVaska wants to merge 49 commits intomainfrom
hw6

Conversation

@ArtemVaska
Copy link
Owner

No description provided.

ArtemVaska and others added 30 commits October 7, 2023 16:11
Add dna_tools.py, protein_tools.py, fastq_tools.py
Add "Possible commands" to run_dna_rna_tools and run_ultimate_protein_tools functions
Add reading option from gbk file: gene_name and translation
Transform output value in dict to list for next processing
- Add docstrings for all functions
- Create select_genes_from_gbk_to_fasta function with partial functionality as intended
- Comment cds_counter in read_gbk function
- Update import
@ArtemVaska
Copy link
Owner Author

Забыл добавить ссылку в гугл-класс. Сделал это после дедлайна

"""

seqs = {}
with open(input_path + '.fastq') as fastq_file:

Choose a reason for hiding this comment

The reason will be displayed to describe this comment to others. Learn more.

До этой строки было бы неплохо сделать проверку на то, что передалось в функцию. Если это путь, то к нему не надо дописывать расширение .fastq

if not os.path.exists(dir_name):
os.mkdir(dir_name)

with open(os.path.join(dir_name, output_filename + '.fastq'), mode='w') as file:

Choose a reason for hiding this comment

The reason will be displayed to describe this comment to others. Learn more.

Если в фильтратор был передан путь, то внутри папки с результатами функция будет пытаться искать весь ээтот путь, и туда записать файл
Вопрос решается применением os.basename(), которая вернет имя непосредственно файла

"""

seqs = {}
with open(input_fasta + '.fasta') as multiline_fasta:

Choose a reason for hiding this comment

The reason will be displayed to describe this comment to others. Learn more.

та же самая проблема со сборкой имени, если передан путь с расширением

Comment on lines +117 to +119
# genes: List[str],
# n_before: int = 1,
# n_after: int = 1,

Choose a reason for hiding this comment

The reason will be displayed to describe this comment to others. Learn more.

Ой, закомменченный код.... Если он не нужен, но надо его просто убирать из скрипта
Но видимо, он все же нужен, без него функция не работает

@pavlovanadia
Copy link

pavlovanadia commented Oct 26, 2023

Это была сложная домашка, так что не переживай) Самое главное, что основы работы с файлами освоены, остальное - вопрос тренировки и тестирования своего кода:)

Комментарии:

  • README обновлен, супер)
  • filter_fastq_seqs не работает, если ей передать путь до файла, она по дефолту дописывает к переданному аргументы .fastq и затем не находит такой файл. Работает только с именем файла без расширения
  • filter_fastq_seqs записывает результат в нужную папку, но имя получившегося файла при передаче только инпута - полностью его дублирует. Если в качестве инпута был передан путь, то функция будет пытаться внутри папки с результатами искать весь путь (которого, разумеется, нет). Для избежания такой проблемы стоит использовать os.basename()
  • convert_multiline_fasta_to_oneline - та же самая проблема со именем файла, если передан путь
  • select_genes_from_gbk_to_fasta - не принимает аргументы, которые были указаны в задании. Почему-тоони были закомменчены
  • select_genes_from_gbk_to_fasta - аутпут в формате .fasta.fasta
  • select_genes_from_gbk_to_fasta - результат работы функции неправильный по сравнению с тестовыми данными, выводятся все риды вне зависимости от инпута, если раскомментить опции для передачи аргументов

Итог:

  • Доработка FASTQ-модуля - 1.5 балла (-0.5 за выходное имя файла)
  • convert_multiline_fasta_to_oneline - 3.5 балла (-0.5 за сборку имени файла)
  • select_genes_from_gbk_to_fasta - 1 балл (баллы даны за наличие чтения и записи в файл)
  • -0.1 за отсутствие докстринг
  • -0.1 за не всегда PEP8

Cумма: 5.8

Sign up for free to join this conversation on GitHub. Already have an account? Sign in to comment

Labels

None yet

Projects

None yet

Development

Successfully merging this pull request may close these issues.

2 participants