Przemysław Solecki

Expert Data Science w Tribe Aplikacji Operacyjnych.
W ING zajmuje się tworzeniem modeli machine learning, treningami sieci neuronowych, rozwiązaniami opartymi o NLP i GenAI.  Szkoli, pisze i prezentuje. Chociaż jego naturalnym środowiskiem są conda envy, to jednak pasjonują go również treningi w naturze – bieganie, górskie wyprawy i wykręcanie długich dystansów na rowerze.

Augmentacja danych w przetwarzaniu języka naturalnego

06.12.2024 |  Przemysław Solecki

Analiza tekstu wymaga ogromnych ilości danych. Bogactwo słownictwa, ilość możliwych rozwiązań składniowych, neologizmy, błędy – w rezultacie możliwości wyrażania tej samej treści na różne sposoby są praktycznie nieograniczone. Z drugiej strony modele posiadają miliony parametrów, dzięki którym są w stanie zrozumieć język naturalny. To co jest ich zaletą, staje się jednak wadą, gdy nie jesteśmy w stanie dostarczyć wystarczająco bogatego zbioru treningowego. 

Czytaj więcej