Ансамблови методи - Общ преглед, категории, основни типове

Ансамбълните методи са техники, които имат за цел да подобрят точността на резултатите в моделите чрез комбиниране на множество модели, вместо да използват един модел. Комбинираните модели значително увеличават точността на резултатите. Това повиши популярността на ансамбловите методи в машинното обучение.

Ансамблови методи

Кратко обобщение

  • Методите на ансамбъла целят подобряване на предсказуемостта в моделите чрез комбиниране на няколко модела, за да се получи един много надежден модел.
  • Най-популярните ансамблови методи са усилване, пакетиране и подреждане.
  • Ансамбълните методи са идеални за регресия и класификация, където намаляват пристрастия и вариации, за да повишат точността на моделите.

Категории на ансамблови методи

Ансамбловите методи се разделят на две широки категории, т.е. последователни техники на ансамбъл и техники на паралелни ансамбли. Техниките на последователен ансамбъл генерират базови обучаеми в последователност, например Адаптивно усилване (AdaBoost). Последователното генериране на базови обучаеми насърчава зависимостта между базовите обучаеми. След това ефективността на модела се подобрява чрез присвояване на по-големи тегла на по-рано представените ученици.

При паралелните техники на ансамбъла , базовите обучаеми се генерират в паралелен формат, напр. Произволна гора Случайна гора Случайна гора е техника, използвана при моделиране на прогнози и анализ на поведението и е изградена върху дървета за вземане на решения. Случайната гора съдържа много дървета за решения. Паралелните методи използват паралелното генериране на базови учащи, за да насърчат независимостта между базовите обучаеми. Независимостта на базовите обучаеми значително намалява грешката поради прилагането на средни стойности.

По-голямата част от техниките на ансамбъла прилагат един алгоритъм в базовото обучение, което води до хомогенност при всички базови обучаеми. Хомогенни базови обучаеми се отнася до базови учащи от същия тип, със сходни качества. Други методи прилагат хетерогенни базови обучаеми, което поражда хетерогенни ансамбли. Хетерогенните базови обучаеми са учащи от различни видове.

Основни видове ансамблови методи

1. Багаж

Bagging, кратката форма за агрегиране на bootstrap, се прилага главно при класификация и регресия Регресионен анализ Регресионният анализ е набор от статистически методи, използвани за оценка на връзките между зависима променлива и една или повече независими променливи. Може да се използва за оценка на силата на връзката между променливите и за моделиране на бъдещата връзка между тях. . Той увеличава точността на моделите чрез използването на дървета за вземане на решения, което намалява до голяма степен вариацията. Намаляването на дисперсията увеличава точността, като по този начин елиминира прекаленото оборудване, което е предизвикателство за много прогнозни модели.

Багажът се класифицира в два вида, т.е. зареждане и агрегиране. Bootstrapping е техника за вземане на проби, при която пробите се извличат от цялата популация (набор), като се използва процедурата за заместване. Вземането на проби с метод на замяна помага да се направи процедурата за подбор на случаен принцип. Базовият алгоритъм за обучение се изпълнява върху пробите, за да завърши процедурата.

Агрегирането в пакетирането се извършва, за да се включат всички възможни резултати от прогнозата и рандомизира резултата. Без обобщаване прогнозите няма да бъдат точни, тъй като не се вземат предвид всички резултати. Следователно агрегирането се основава на процедурите за първоначално изтегляне на вероятността или на базата на всички резултати от прогнозните модели.

Багажът е изгоден, тъй като учениците със слаба база се комбинират, за да формират един силен ученик, който е по-стабилен от единичните. Той също така елиминира всякакви отклонения, като по този начин намалява пренастройването на моделите. Едно ограничение на багажа е, че то е изчислително скъпо. По този начин може да доведе до повече пристрастия в моделите, когато се пренебрегне правилната процедура за пакетиране.

2. Повишаване

Повишаването е ансамбъл техника, която се учи от предишни грешки предиктори, за да прави по-добри прогнози в бъдеще. Техниката комбинира няколко ученици със слаба база, за да формира един силен ученик, като по този начин значително подобрява предвидимостта на моделите. Подсилването работи чрез подреждане на слабите обучаеми в последователност, така че слабите учащи се учат от следващия обучаван в последователността, за да създадат по-добри модели за предсказване.

Повишаването има много форми, които включват усилване на градиента, адаптивно усилване (AdaBoost) и XGBoost (екстремно усилване на градиента). AdaBoost използва слаби обучаеми, които са под формата на дървета за вземане на решения, които включват най-вече един сплит, който е известен като пънове за вземане на решения. Основният пън на AdaBoost включва наблюдения с подобни тежести.

Повишаване на градиента Повишаване на градиента Повишаването на градиента е техника, използвана при създаването на модели за прогнозиране. Техниката се използва най-вече при процедури за регресия и класификация. добавя предсказатели последователно към ансамбъла, където предшестващите предиктори коригират своите наследници, като по този начин увеличават точността на модела. Новите предиктори са годни да противодействат на ефектите от грешките в предишните предиктори. Градиентът на спускане помага на усилвателя на градиента да идентифицира проблеми в прогнозите на обучаемите и да ги противодейства съответно.

XGBoost използва дървета за решения с усилен градиент, осигурявайки подобрена скорост и производителност. Той разчита до голяма степен на изчислителната скорост и производителността на целевия модел. Обучението на модела трябва да следва последователност, като по този начин внедряването на машини с усилен градиент се забавя.

3. Подреждане

Подреждането, друг метод на ансамбъл, често се нарича обобщено подреждане. Тази техника работи, като позволява на тренировъчен алгоритъм да събере няколко други подобни прогнози за алгоритъм на обучение. Подреждането е успешно приложено в регресия, оценки на плътността, дистанционно обучение и класификации. Той може да се използва и за измерване на честотата на грешките по време на пакетиране.

Намаляване на отклоненията

Ансамбълните методи са идеални за намаляване на отклонението в моделите, като по този начин се увеличава точността на прогнозите. Дисперсията се елиминира, когато множество модели се комбинират, за да образуват една прогноза, която се избира от всички други възможни прогнози от комбинираните модели. Ансамбъл от модели е актът на комбиниране на различни модели, за да се гарантира, че полученото прогнозиране е възможно най-доброто, въз основа на разглеждането на всички прогнози.

Допълнителни ресурси

Finance е официален доставчик на глобалния сертифициран банков и кредитен анализатор (CBCA) ™ CBCA ™ сертифициране Сертифицираният банков и кредитен анализатор (CBCA) ™ акредитация е глобален стандарт за кредитни анализатори, който обхваща финанси, счетоводство, кредитен анализ, анализ на паричните потоци , моделиране на завети, изплащане на заеми и др. програма за сертифициране, предназначена да помогне на всеки да стане финансов анализатор от световна класа. За да продължите да напредвате в кариерата си, допълнителните финансови ресурси по-долу ще бъдат полезни:

  • Еластична мрежа Еластична мрежа Еластична мрежа използва линейно наказанията както от ласо, така и от хребетни техники, за да регулира моделите на регресия. Техниката съчетава както ласото, така и
  • Overfitting Overfitting Overfitting е термин, използван в статистиката, който се отнася до грешка при моделиране, която възниква, когато дадена функция съответства твърде тясно на определен набор от данни
  • Мащабируемост Мащабируемост Мащабируемостта може да попадне както в контекста на финансовата, така и в бизнес стратегията. И в двата случая това означава способността на субекта да издържа на натиск от
  • Spoofing Spoofing Spoofing е разрушителна алгоритмична практика на търговия, която включва поставяне на оферти за покупка или оферти за продажба на фючърсни договори и отмяна на офертите или офертите преди изпълнението на сделката. Практиката има за цел да създаде фалшива картина на търсенето или фалшивия песимизъм на пазара.