Skip to content

novikovadaria/MindBox_PythonTestTask

Folders and files

NameName
Last commit message
Last commit date

Latest commit

 

History

3 Commits
 
 
 
 

Repository files navigation

MindBox_PythonTestTask

Задание:

В PySpark приложении датафреймами(pyspark.sql.DataFrame) заданы продукты, категории и их связи. Каждому продукту может соответствовать несколько категорий или ни одной. А каждой категории может соответствовать несколько продуктов или ни одного. Напишите метод на PySpark, который в одном датафрейме вернет все пары «Имя продукта – Имя категории» и имена всех продуктов, у которых нет категорий.

Task:

In a PySpark application, products, categories, and their relationships are defined as dataframes (pyspark.sql.DataFrame). Each product may have several categories or none. And each category may have several products or none. Write a PySpark method that will return all Product Name – Category Name pairs and the names of all products that do not have categories in one dataframe.

About

Тестовое задание на позицию Trainee Data Engineer Developer в MindBox

Topics

Resources

Stars

Watchers

Forks

Releases

No releases published

Packages

No packages published

Languages