SKN Data Science Management SGH

SKN Data Science Management SGH

Udostępnij

Jesteśmy organizacją studencką ze Szkoły Głównej Handlowej mającą na celu stworzenie hubu zrzeszającego liderów nowej ekonomii opartej na Big Data. Łączymy ludzi z wielu środowisk i z uczelni o różnych profilach. Działamy wykorzystując project management oraz podejmujemy decyzje oparte na analizie danych. Jeśli widzę dalej, to tylko dlatego, że stoję na ramionach olbrzymów.

06/06/2024

❗️❗️❗️Nasz projekt na dużej konferencji ❗️❗️❗️

W imieniu wszystkich członków SKN Data Science Management pragniemy was zaprosić na konferencję MedTech 4.0 – (R)ewolucja w medycynie i biznesie! Jest to wydarzenie poświęcone wykorzystaniu AI i nowoczesnych technologii w biznesie w branży medycznej na którym będziecie mieli okazję zaczerpnąć dużą dawkę wiedzy i inspiracji od prawdziwych ekspertów w branży. 👀👩‍🔬🦸‍♂️

Dla nas jest to wyjątkowe wydarzenie, ponieważ weźmiemy w nim czynny udział! W sobotę zaprezentujemy wam efekty naszej ciężkiej pracy, czyli projekt czymoddycham.pl poświęcony wpływowi zanieczyszczenia powietrza na wystąpienie zawału serca tworzony we współpracy z Warszawski Uniwersytet Medyczny.💕👩‍🔬

Z tego miejsca pragniemy serdecznie podziękować Blockchain Society Poland i dr Wojciech Kurowski za możliwość wystąpienia na konferencji, a także gratulacje za organizację wydarzenia tej skali. 🤝👏⭐️

Wstęp na wydarzenie jest wolny, w celu uczestnictwa prosimy o wypełnienie formularza: https://docs.google.com/forms/d/e/1FAIpQLSdSZWZZWPL0wNXhjIy2EtYYnVFJfMwVlza5NobHT7eOd9ZD7Q/viewform

Wszystkich zainteresowanych zapraszamy w sobotę 8 czerwca do budynku G SGH przy al. Niepodległości 152 od godziny 10. Jeszcze raz gratulujemy organizatorom, widzimy się w sobotę! 🎉🎉🎉

15/02/2024

Jak stworzyć turbowzmocnione drzewo decyzyjne❓ 🌳🚀 Dziś przyjrzymy się Gradient Boosting'owi!

Gradient Boosting to zaawansowana technika nadzorowanego uczenia maszynowego, która również znajduje szerokie zastosowanie w zadaniach klasyfikacji oraz regresji. W przeciwieństwie do lasów losowych, które opierają się na współpracy wielu drzew decyzyjnych, Gradient Boosting działa na zasadzie budowy pojedynczego drzewa w iteracyjny sposób, minimalizując błędy prognozowane przez poprzednie drzewo. 🌳🌳🌳

Podstawową ideą Gradient Boostingu jest budowa drzewa decyzyjnego, które koryguje błędy poprzedniego drzewa, skupiając się na obszarach, w których prognozy były niedokładne. Proces ten powtarza się wielokrotnie, a każde kolejne drzewo dostosowuje się do reszt błędów poprzednich drzew, poprawiając skuteczność modelu. W ten sposób tworzymy coraz potężniejsze pojedyncze drzewo. Ostateczny model będzie wynikową agregacją wszystkich drzew decyzyjnych, jakie posłużyły nam w trakcie jego tworzenia. 👀📈

Gradient Boosting wykorzystuje gradient funkcji straty (stąd nazwa), czyli kierunek największego spadku błędu prognozy. Popularne funkcje straty obejmują Mean Squared Error (MSE) w przypadku regresji i Cross-Entropy w przypadku klasyfikacji. Korzyści z Gradient Boostingu obejmują zdolność do modelowania bardziej złożonych wzorców w danych, skuteczność w radzeniu sobie z problemem nadmiernego dopasowania (overfittingu) i umiejętność obsługi różnorodnych typów danych.

Jak wyglądałby proces budowy modelu wykorzystującego Gradient Boosting❓

Na sam początek - pierwsze drzewo próbuje zamodelować dane.
Obliczanie reszt - liczymy różnice między prognozą a rzeczywistą wartością.
Budowa kolejnego drzewa, które koncentruje się na zredukowaniu pozostałych błędów.
Proces powtarzamy, jak już wiemy, każde kolejne drzewo skupi się na korygowaniu reszt poprzednich drzew, powtarzamy aż do osiągnięcia określonej liczby drzew lub osiągnięcia zdefiniowanego przez nas celu. 🌱🌿🌳

08/02/2024

Drzewa omówione, pora na lasy! Dziś kładziemy pod lupę lasy losowe! 🌳🌲🌿

Lasy losowe to potężne narzędzie w obszarze uczenia maszynowego, znakomicie sprawdzające się w klasyfikacji oraz regresji. Składają się z wielu drzew decyzyjnych, które współpracują, aby osiągnąć bardziej stabilne i precyzyjne wyniki. 🌟💡

Podobnie jak drzewa decyzyjne, lasy losowe opierają się na zestawie reguł decyzyjnych wywnioskowanych z danych uczących. 📊🔍 Las składający się z wielu drzew (co nawet brzmi intuicyjnie) wykorzystuje technikę ensemble learning, co oznacza, że łączą wyniki wielu modeli w celu uzyskania lepszej wydajności predykcyjnej. 🌳🌟

W tym przypadku każde drzewo wnosi swój wkład do procesu decyzyjnego, a końcowa klasyfikacja lub prognoza jest rezultatem głosowania wszystkich drzew. 🌟🗳️ Czym jest to głosowanie? Jest to proces klasyfikacji lub predykcji w lesie losowym, w którym wybierane są większościowe wyniki z poszczególnych drzew. 📊🌟 W przypadku klasyfikacji, klasa otrzymująca największą liczbę głosów zostaje uznana za wynik. W przypadku regresji, można uśrednić wyniki z poszczególnych drzew.

Dzięki temu lasy losowe są odporne na pojedyncze błędy i wykazują większą stabilność w różnych sytuacjach. 📊 Podobnie jak w przypadku drzew decyzyjnych, interpretowalność i łatwość wizualizacji są silnymi stronami lasów losowych. Dodatkowo dzięki zastosowaniu wielu drzew, są one bardziej odporne na overfitting, co może występować przy pojedynczych drzewach. 🌟🌳

Proces budowy lasu losowego opiera się na generowaniu wielu drzew decyzyjnych, każdego na podstawie innego podzbioru danych wejściowych. Kombinacja wyników tych drzew prowadzi do ostatecznej prognozy modelu. Kryteria podziału, takie jak entropia czy współczynnik Giniego, są również używane w procesie budowy drzew w ramach lasu losowego. 🌲🌿🔍

Chcesz aby twoja firma była na górze listy Sklep Odzieżowy w Warsaw?
Kliknij tutaj, aby odebrać Sponsorowane Ogłoszenie.

Strona Internetowa

Adres


Warsaw