Разработка функций
Разработка функций описывается как этап предварительной обработки в машинном обучении, который преобразует необработанные данные в более эффективный набор входных данных, которые имеют несколько атрибутов, известных как функции.
Успех моделей машинного обучения во многом зависит от качества функций, используемых для их обучения. Проектирование функций включает в себя набор методов, которые позволяют нам создавать новые функции путем объединения или преобразования существующих. Эти методы помогают выделить наиболее важные закономерности и взаимосвязи в данных, что, в свою очередь, помогает модели машинного обучения более эффективно учиться на данных.
Ключевые методы разработки функций
Проектирование функций можно разделить на два ключевых этапа, а именно:
Предварительная обработка данных
Понимание бизнеса (знания предметной области)
Предварительная обработка данных
Обычно это этап разработки функций, который включает в себя подготовку и обработку данных в соответствии с текущими потребностями машинного языка. Среди них здесь используются различные техники;
Обработка пропущенных значений, где можно использовать такие методы, как вменение (среднее, медиана, мода) или использование алгоритмов, которые изначально обрабатывают пропущенные значения.
Кодирование категориальных переменных, где категориальные данные должны быть преобразованы в числовую форму для большинства алгоритмов с использованием общих методов, таких как горячее кодирование, кодирование меток и целевое кодирование.
Масштабирование и нормализация, при которых функции масштабирования гарантируют, что они вносят равный вклад в модель. Методы включают стандартизацию (z-показатель)
Взаимодействие функций и создание функций, при котором существующие функции объединяются для создания новых функций, создавая тем самым сложные связи с данными
Сокращение размерности, когда такие методы, как PCA (анализ главных компонентов) или t-SNE, уменьшают количество функций, сохраняя при этом наиболее важную информацию.
EDA также может использоваться при разработке функций и обычно является предшественником разработки функций.
Знание предметной области
Знания в предметной области относятся к пониманию и опыту в конкретной области или отрасли. В разработке функций это предполагает применение знаний и понимания контекста и взаимосвязей данных для создания значимых функций, которые могут повысить производительность модели.
Это помогает определить, какие функции имеют отношение к рассматриваемой проблеме, и понять взаимосвязь данных.
Отказ от ответственности: Все предоставленные ресурсы частично взяты из Интернета. В случае нарушения ваших авторских прав или других прав и интересов, пожалуйста, объясните подробные причины и предоставьте доказательства авторских прав или прав и интересов, а затем отправьте их по электронной почте: [email protected]. Мы сделаем это за вас как можно скорее.
Copyright© 2022 湘ICP备2022001581号-3