Повишаване - Общ преглед, формуляри, плюсове и минуси, опционални дървета

Boosting е алгоритъм, който помага за намаляване на отклоненията и пристрастията в ансамбъл за машинно обучение. Алгоритъмът на алгоритъма (Algos) Алгоритмите (Algos) са набор от инструкции, които се въвеждат за изпълнение на задача. Въвеждат се алгоритми за автоматизиране на търговията с цел генериране на печалби с честота, невъзможна за човек търговец, помага при превръщането на слабите обучаеми в силни обучаеми чрез комбиниране на N брой обучаващи се.

Източник: Sirakorn [CC BY-SA]

Подобряването също може да подобри прогнозите на моделите за учене на алгоритми. Слабите учащи се коригират последователно от своите предшественици и в процеса се превръщат в силни учещи.

Форми на усилване

Подсилването може да има няколко форми, включително:

1. Адаптивно усилване (Adaboost)

Adaboost има за цел да комбинира няколко слаби учащи, за да формира един силен учещ. Adaboost се концентрира върху слаби обучаеми, които често са дървета за вземане на решения само с едно разделяне и обикновено се наричат пънове за вземане на решения. Първият пън за вземане на решения в Adaboost съдържа наблюдения, които се претеглят еднакво.

Предишните грешки се коригират и на всички наблюдения, които са били класифицирани неправилно, се присвоява по-голяма тежест, отколкото на други наблюдения, които не са имали грешка в класификацията. Алгоритмите от Adaboost се използват широко в процедурите за регресия и класификация. Грешка, забелязана в предишни модели, се коригира с претегляне, докато се направи точен предсказател.

2. Повишаване на градиента

Повишаването на градиента, подобно на всяка друга процедура за машинно обучение на ансамбъл, последователно добавя предиктори към ансамбъла и следва последователността при коригиране на предшестващите предиктори, за да стигне до точен предиктор в края на процедурата. Adaboost коригира предишните си грешки, като настройва теглата за всяко неправилно наблюдение във всяка итерация, но усилването на градиента има за цел да постави нов предиктор в остатъчните грешки, извършени от предходния предиктор.

Повишаването на градиента използва градиентното спускане, за да определи предизвикателствата в предишните прогнози на обучаемите. Предишната грешка се подчертава и чрез комбиниране на един слаб ученик със следващия, грешката се намалява значително с течение на времето.

3. XGBoost (Extreme Gradient Boosting)

XGBoostimg прилага дървета за решения с усилен градиент, подобрена производителност и скорост. Внедряването на машини с усилен градиент е относително бавно, поради обучението на модела, което трябва да следва последователност. Следователно им липсва мащабируемост Мащабируемост Мащабируемостта може да попадне както в контекста на финансовата, така и в бизнес стратегията. И в двата случая това означава способността на субекта да издържа на натиск поради бавността им.

XGBoost зависи от производителността на модела и изчислителната скорост. Той предоставя различни предимства, като паралелизация, разпределено изчисление, оптимизация на кеш паметта и изчисления извън ядрото.

XGBoost осигурява успоредяване при изграждането на дървета чрез използване на ядрата на процесора по време на обучение. Той също така разпространява изчисленията, когато обучава големи модели, използвайки машинни клъстери. Изчисленията извън ядрото се използват за по-големи набори от данни, които не могат да се поберат в конвенционалния размер на паметта. Оптимизацията на кеша също се използва за алгоритми и структури от данни, за да оптимизира използването на наличния хардуер.

Плюсове и минуси на усилването

Като модел на ансамбъл, усилването идва с лесен за четене и интерпретиране алгоритъм, което прави интерпретациите на неговите прогнози лесни за работа. Възможността за прогнозиране е ефективна чрез използването на нейните клониращи методи, като пакетиране в пакети (агрегиране на Bootstrap). Ансамбълното машинно обучение може да бъде главно категоризирано в пакетиране и ускоряване. Техниката на пакетиране е полезна както за регресия, така и за статистическа или случайна гора и дървета за вземане на решения. Повишаването е еластичен метод, който лесно ограничава прекаленото прилягане.

Един недостатък на ускоряването е, че той е чувствителен към отклонения, тъй като всеки класификатор е длъжен да коригира грешките в предшествениците. По този начин методът е твърде зависим от извънредни стойности. Друг недостатък е, че методът е почти невъзможно да се разшири. Това е така, защото всеки оценител основава своята коректност на предишните предиктори, като по този начин процедурата е трудна за рационализиране.

Какво представляват опционалните дървета?

Дърветата с опции са заместителите на дърветата за решения. Те представляват ансамблови класификатори, докато извеждат една структура. Разликата между дърветата за опции и дърветата за решения е, че първото включва както възлови възли, така и възли за вземане на решения, докато последното включва само възли за вземане на решения.

Класификацията на даден екземпляр изисква филтрирането му през дървото. За избор на един от клоновете е необходим възел за вземане на решение, докато възел с опции е необходим, за да вземе цялата група клонове. Това означава, че с опционен възел, човек завършва с множество листа, които ще изискват комбиниране в една класификация, за да се получи прогноза. Следователно гласуването е необходимо в процеса, когато мнозинството гласове означава, че възелът е избран като прогноза за този процес.

Горният процес дава ясно да се разбере, че опционните възли не трябва да се предлагат с две опции, тъй като в крайна сметка ще загубят гласа, ако не могат да намерят определен победител. Другата възможност е да се вземат средните оценки на вероятностите от различни пътища, като се следват подходи като байесов подход или не-претеглен метод на средни стойности.

Дърветата на опциите също могат да бъдат разработени чрез модифициране на съществуващите обучаеми в дървото за решения или създаване на възел с опции, където са свързани няколко разделения. Всяко дърво за решения в рамките на допустимото ниво на толерантност може да бъде преобразувано в дървета с опции.

Още ресурси

Finance е официалният доставчик на сертифициран банков и кредитен анализатор (CBCA) ™ Сертифициране на CBCA ™ Сертифицираният банков и кредитен анализатор (CBCA) ™ е глобален стандарт за кредитни анализатори, който обхваща финанси, счетоводство, кредитен анализ, анализ на паричните потоци, моделиране на завети, изплащане на заеми и др. програма за сертифициране, предназначена да превърне всеки във финансов анализатор от световна класа.

За да продължите да учите и развивате своите знания за финансов анализ, горещо препоръчваме допълнителните финансови ресурси по-долу:

Fintech (финансови технологии) Fintech (финансови технологии) Терминът fintech се отнася до синергията между финанси и технологии, която се използва за подобряване на бизнес операциите и предоставянето на финансови услуги
Количествени финанси Количествени финанси Количествените финанси са използването на математически модели и изключително големи масиви от данни за анализ на финансови пазари и ценни книжа. Общите примери включват (1) ценообразуване на деривативни ценни книжа, като опции, и (2) управление на риска, особено що се отнася до управлението на портфейла
Spoofing Spoofing Spoofing е разрушителна алгоритмична практика на търговия, която включва поставяне на оферти за покупка или оферти за продажба на фючърсни договори и отмяна на офертите или офертите преди изпълнението на сделката. Практиката има за цел да създаде фалшива картина на търсенето или фалшивия песимизъм на пазара.
Ръководство за заплата на софтуерен инженер В това ръководство за заплати на софтуерен инженер ние обхващаме няколко работни места за софтуерен инженер и съответстващите им средни заплати за 2018 г. Софтуерният инженер е професионалист, който прилага принципите на софтуерния инженеринг в процесите на проектиране, разработване, поддръжка, тестване и оценка на софтуер, използван в компютъра