My deep learning

Блог про нейронные сети и машинное обучение

Oct 28, 2019

Подготовка данных: кодирование категориальных признаков

Теги: preprocessing  category-encoders  sklearn  scikit-learn  ml-data 

В статье «особенности препроцессинга данных в scikit-learn» разбирались особенности кодирования признаков с помощью библиотеки scikit-learn. К сожалению, набор инструментов scikit-learn довольно скромный. Часто данные содержат множественные категориальные признаки с разными... читать дальше

Oct 19, 2019

Вычислительная сложность машинного обучения. Базовые принципы

Теги: machine-learning  algorithms  time-complexity 

Чуть ранее, в статье временная сложность алгоритмов машинного обучения, я разбирал временную сложность некоторых алгоритмов из библиотеки scykit-learn. Настало время немного подробнее остановиться на том, как в принципе считается вычислительная... читать дальше

Oct 8, 2019

Особенности препроцессинга данных в scikit-learn

Теги: machine-learning  scikit-learn  ml-data  preprocessing 

В статье кратко раскрываются некоторые вопросы подготовки данных с помощью scikit-learn. Замена пропусков Scikit-learn не поддерживает замену пропусков с разными значениями. Сначала придется последовательно перегнать все интересующие пропуски, к примеру,... читать дальше

Sep 28, 2019

Зависимость вычислений в scikit-learn от данных и модели

Теги: machine-learning  algorithms  time-complexity  scikit-learn  ml-data  computation-performance 

Производительность вычислений В scikit-learn производительность вычисления предсказаний зависит от: количества фичей распределения и разреженности данных временной сложности алгоритма извлечения фичей Количество фичей Библиотека хорошо оптимизирована под небольшие дата-сеты, поэтому количество... читать дальше

Sep 14, 2019

Основные термины машинного обучения. Часть №2

Теги: machine-learning 

В первой части статьи я разобрал базовую терминологию ML: постановку задачи, емкость, переобучение и недообучение, регуляризацию и гиперпараметры, точечную оценку, смещение оценки, дисперсию, стандартную ошибку и состоятельность, а так-же важные... читать дальше

Смотерть все посты...

API (1) algorithms (3) category encoders (1) computation performance (1) cs231n (4) knn (1) machine learning (6) ml data (3) phyton (3) preprocessing (2) scikit learn (7) sklearn (4) softmax (1) svm (1) time complexity (3)

Этот проект поддерживается KonstantinKlepikov