Skip to content

Conversation

@grishchenkoira
Copy link
Owner

No description provided.

grishchenkoira and others added 30 commits October 7, 2023 23:46
Copy link

@IvanKozlov98 IvanKozlov98 left a comment

Choose a reason for hiding this comment

The reason will be displayed to describe this comment to others. Learn more.

Параллельный лес: 22/25

Bio_Files_Processor.py Bio_Seq_Analysis_Tool.py must be bio_files_processor.py bio_seq_analysis_tool.py — должен быть единый стиль именования файлов
в readme в разделе контактов обычно указывают контакты :)
хотя бы почту или тг

+1б в целом, отличное оформление

Итого: 48 баллов

Fitted estimator.
'''

with ThreadPoolExecutor(n_jobs) as pool:

Choose a reason for hiding this comment

The reason will be displayed to describe this comment to others. Learn more.

-3 балла (CPU-bound задача - нужны процессы)
То есть нужно было использовать ProcessPoolExecutor

tree = DecisionTreeClassifier(max_depth=self.max_depth,
max_features=self.max_features,
random_state=self.random_state)
fit_tasks.append(pool.submit(tree.fit, X_sample, y_sample))

Choose a reason for hiding this comment

The reason will be displayed to describe this comment to others. Learn more.

непосредственный фитинг деревьев вы сделали параллельным (псевдо, конечно)
но забыли про подготовку данных и создание объекта дерева -- было бы здорово также делать это параллельно. :)

'''
probas = np.zeros((X.shape[0], len(self.classes_)))
with ThreadPoolExecutor(n_jobs) as pool:
predict_proba_tasks = [pool.submit(tree.predict_proba,

Choose a reason for hiding this comment

The reason will be displayed to describe this comment to others. Learn more.

в целом ок, но почему не map ?)

Sign up for free to join this conversation on GitHub. Already have an account? Sign in to comment

Labels

None yet

Projects

None yet

Development

Successfully merging this pull request may close these issues.

2 participants