Odcinek 1. ReCAPTCHA bez tajemnic.

Nazywam się Robotowski… Edward Robotowski. Tak wiem, brzmi jak historia o słynnym Agencie 007. Ale powiem Wam, że moje przygody są równie intrygujące co bohatera powieści Iana Fleminga. Dodatkowo jestem ogromnym fanem Jamesa Bonda i tak samo jak on uwielbiam nowinki technologiczne. Mamy też inny wspólny sekret, lecz o tym, kiedy indziej. Ale zacznijmy od początku.

W ciągu najbliższych tygodni chciałbym zabrać Was w fascynujący świat automatyzacji, który mnie samego pochłonął bez granic. O wszelkich innowacjach oraz możliwościach jakie daje automatyzowanie procesów mógłbym opowiadać w nieskończoność. Dzięki pracy w zespole XELTO DIGITAL mogę na bieżąco czerpać wiedzę od naszych ekspertów i dzielić się nią z Wami na łamach bloga:

Okiem Eksperta:

Czy robot mówiący „Nie jestem robotem” mija się z prawdą?

Praca ze stronami internetowymi i aplikacjami webowymi to jedna z podstawowych rzeczy, z którymi roboty muszą sobie radzić w codziennej pracy. Ale co jeśli mamy idealnego kandydata: proces prosty, ustrukturyzowany z cyfrowymi danymi wejściowymi, a na drodze do realizacji celu staje słynne „I’m not a robot”? Na szczęście to nie koniec świata (ani też naszego projektu), bo dysponujemy kilkoma opcjami.

Po pierwsze, zwłaszcza jeśli pracujemy na wewnętrznej aplikacji, możemy skontaktować się z administratorem z prośbą o przygotowanie wersji strony bez reCAPTCHA. Znając życie, częściej jednak będziemy musieli sami sobie z tym problemem poradzić. Aktualnie możemy wykorzystać zarówno płatne (choć niewiele) lub bezpłatne rozwiązania oparte o uczenie maszynowe. Płatne pozwolę sobie pominąć, w Internecie można znaleźć ich bardzo dużo, a zasady ich działania najlepiej przybliżą ich sprzedawcy. Zanim jednak z nich skorzystacie, sprawdźcie wtyczkę Buster: Captcha Solver for Humans. Dostępna jest ona zarówno jako dodatek do Chrome, jak i FireFox.

Na czym to polega?

Wtyczka dodaje do okna reCAPTCHA nowy przycisk, którego kliknięcie uruchomi dźwiękową wersję reCAPTCHA, ukradkiem odsłucha ją, a następnie wpisze poprawnie rozwiązanie zadania. Dodam, że jest to przycisk, który nasz robot bez problemu może kliknąć!

Jak to wygląda?

Kiedy nasz robot uruchomi reCAPTCHA, są dwa wyjścia. Najlepszym dla nas rozwiązaniem jest, kiedy mechanizm nas po prostu przepuści. Ale jeśli nie, to pojawi nam się dobrze znane okienko z obrazkami. Po instalacji wtyczki pojawił się trzeci przycisk pomarańczowego ludzika, który jest właśnie naszym rozwiązaniem. Naciśnięcie tego przycisku przez robota uruchamia automatyczne rozwiązanie zadania. Jedyne co pozostaje teraz, to odpowiednie obudowanie stworzonej procedury celem monitorowania zachowania reCAPTCHA.

Czy jest to idealne rozwiązanie?

Nie. Przy dużej liczbie logowań reCAPTCHA potraktuje nas jako atak na stronę i zablokuje jakiekolwiek próby połączenia się ze stroną. Ponadto, o ile praca na aktywnym ekranie działa bardzo dobrze zarówno w Chrome, jak i w Firefox, o tyle przeniesienie tego na maszynę wirtualną utrudnia komunikację. Z mojego doświadczenia wynika, że z tym zadaniem lepiej radzi sobie Firefox za pomocą „send window message”, najlepiej w wersji 64, ponieważ w późniejszych występuje błąd powodujący nieodpowiadanie wtyczki (na szczęście uruchomienie przeglądarki ponownie powinno to rozwiązać). Niemniej jednak ten sposób powinien pomóc ominąć ten problem w automatyzacji procesu.

Autor: Rafał Korporowicz – Senior RPA Developer