Pytania do wywiadu Google Data Science: wszystko, co musisz wiedzieć, aby go złamać



W tym artykule znajdziesz zestawienie pytań do wywiadu Google Data Science, procesu rozmowy kwalifikacyjnej i warunków wstępnych ubiegania się o pracę w Google.

Zatrudnienie w firmie o światowej renomie, takiej jak Google, jest dla wielu ludzi wymarzoną pracą. Mają jednych z najbardziej utalentowanych naukowców zajmujących się badaniami AI, i na świecie. Nie ma wielu źródeł dla Google Pytania do wywiadu online i nie jest łatwo znaleźć tam pracę. Dlatego w tym artykule omówię następujące tematy:

Opis stanowiska i wymagania

Ze średnią pensją w wysokości 169 067 $ , w tym premia. Wynagrodzenie analityka danych Google wynosi od 120 000 - 280 000 $ . Mając tak wysokie wynagrodzenie, musisz znać odpowiednie wymagania dotyczące stanowiska, o które się ubiegasz. Chociaż wymagania różnią się w zależności od stanowiska, poniżej znajdują się niektóre z typowych:

Minimalne wymagania:





google

  • Magister dyscypliny ilościowej (statystyka, badania operacyjne, informatyka)
  • 2 lata doświadczenia zawodowego w branży związanej z analizą danych
  • Doświadczenie z oprogramowaniem statystycznym (np. R , , MATLAB, Pandy) oraz
  • Doświadczenie z językami baz danych (np. SQL )

Obowiązki:



podciąg na serwerze sql z przykładem
  • Pracuj z dużymi, złożonymi zestawami danych. Rozwiązuj trudne, nierutynowe problemy analityczne, stosując w razie potrzeby zaawansowane metody analityczne
  • Przeprowadź analizę, która obejmuje gromadzenie danych i specyfikację wymagań, przetwarzanie, analizę, bieżące wyniki i prezentacje
  • Twórz i prototypuj potoki analizy iteracyjnie, aby zapewnić wgląd w dużą skalę
  • Rozwiń wszechstronną wiedzę o strukturach danych i metrykach Google, popierając zmiany tam, gdzie są potrzebne do rozwoju produktu
  • Interakcja międzyfunkcyjna, formułowanie zaleceń biznesowych (np. Kosztów i korzyści, prognozowanie, analiza eksperymentów)
  • Badaj i rozwijaj metody analizy, prognozowania i optymalizacji, aby poprawić jakość produktów Google przeznaczonych dla użytkowników

Proces rozmowy kwalifikacyjnej Google Data Science

Samo wyczyszczenie podręcznej listy jest trudnym zadaniem, które całkowicie zależy od Ciebie CV, list motywacyjny i Doświadczenie . Google Data Science Pytania do wywiadu to mieszanka łamigłówek i pytań technicznych. Zwykle pierwszym procesem jest rozmowa telefoniczna.

Wywiad telefoniczny:

Składa się z pytań opartych głównie na (konkretne i teoretyczne) i mocno oparte na . Pytania różnią się również w zależności od projektów, nad którymi pracowałeś.
  • Przypadek 1: W wywiadach pytano o techniki ekstrakcji cech, PCA (używane w projektach), analizę korelacji, niektóre stosowane techniki klasyfikacji (SVM, GBM, sieć neuronowa). Dlaczego nie regresja logistyczna, dlaczego GBM? - Zasadniczo pytania dotyczą rozdzielności klas.
  • Przypadek 2: Dlaczego warto korzystać z wyboru funkcji? Jeśli dwa predyktory są silnie skorelowane, jaki jest wpływ na współczynniki w regresji logistycznej? Jakie są przedziały ufności współczynników?
  • Przypadek 3: Dysk obraca się na wrzecionie i nie wiesz, w jakim kierunku obraca się dysk. Otrzymujesz komplet szpilek. Jak użyjesz szpilek, aby opisać, w jaki sposób obraca się dysk?
Po rozmowach telefonicznych przyszedł czas na spotkanie twarzą w twarz i rundy kodowania. Omówmy więc niektóre z najczęściej zadawanych pytań podczas wywiadów z Google Data Science. Chociaż te pytania mogą nie być zadawane dokładnie tak, jak podano poniżej, starałem się odpowiedzieć na wiele z nich.

Pytania do wywiadu dotyczącego Google Data Science

Te pytania nie są zagadkami, ponieważ zamiast tego Google przestał je zadawać, mają podobne pytania, które nazywają Pytania dotyczące rozwiązywania problemów . Zadawanych jest wiele pytań dotyczących uczenia maszynowego, od ogólnych po praktyczne. Google zasadniczo obejmuje szeroki zakres tematów, a nie Głębokość. Q1. Jesteś w kasynie i masz dwie kości do gry. Wygrywasz 10 $ za każdym razem, gdy wyrzucisz 5. Jeśli grasz, aż wygrasz, a potem się zatrzymasz, jaka jest oczekiwana wypłata? Q2. Właśnie wsiadasz do samolotu do Londynu, chcesz wiedzieć, czy musisz zabrać ze sobą parasol, czy nie. Dzwonisz do trzech swoich przypadkowych przyjaciół i jak każdy z nich, jeśli pada. Prawdopodobieństwo, że twój przyjaciel mówi prawdę, wynosi 2/3, a prawdopodobieństwo, że kłamie, wynosi 1/3. Jeśli wszyscy 3 mówią, że pada, to jakie jest prawdopodobieństwo, że w Londynie faktycznie pada. Pytanie 3. Jak dodać nowe Facebook członków do bazy danych członków i zakodować ich relacje z innymi w bazie danych? Q4. W jaki sposób przetestujesz, czy istnieje zwiększone prawdopodobieństwo, że użytkownik pozostanie aktywny po 6 miesiącach, biorąc pod uwagę, że ma on teraz więcej znajomych? Pytanie 5. Otrzymujesz 40 kart w czterech różnych kolorach - 10 zielonych, 10 czerwonych, 10 niebieskich i 10 żółtych. Karty każdego koloru są ponumerowane od jednego do dziesięciu. Dwie karty są wybierane losowo. Sprawdź prawdopodobieństwo, że wybrane karty nie są tej samej liczby i tego samego koloru. Pytanie 6. Utwórz program w wybranym języku, aby odczytać plik tekstowy z różnymi tweetami. Wynik powinien zawierać 2 pliki tekstowe - jeden zawierający listę wszystkich unikalnych słów we wszystkich tweetach wraz z liczbą powtórzonych słów, a drugi plik powinien zawierać średnią liczbę unikalnych słów dla wszystkich tweetów. P7. Co zrobisz, jeśli usunięcie brakujących wartości ze zbioru danych spowoduje odchylenie? Pytanie 8. Dysk obraca się na wrzecionie i nie wiesz, w jakim kierunku obraca się dysk. Otrzymujesz komplet szpilek. Jak użyjesz szpilek, aby opisać, w jaki sposób obraca się dysk? P9. Jak zaprojektujesz silnik rekomendacji dla ofert pracy? Pytanie 10. Jaki produkt chcesz stworzyć w Google? P11. Samochody są wyposażone w funkcję speed trackera, aby firmy ubezpieczeniowe mogły śledzić nasz stan jazdy. W oparciu o ten nowy schemat, na jakie pytania biznesowe można odpowiedzieć? P12. Jak możesz zdecydować, czy jeden algorytm jest lepszy od drugiego? P13. Pudełko zawiera 12 czerwonych kartek i 12 czarnych kart. W innym pudełku znajdują się 24 czerwone i 24 czarne karty. Chcesz wylosować dwie karty z jednego z dwóch pudełek, które z nich ma większe prawdopodobieństwo otrzymania kart tego samego koloru i dlaczego? P14. Jaka jest różnica między modelem w worku a modelem wzmocnionym? P15. Co miesiąc tworzysz raport dotyczący treści przesyłanych przez użytkowników i obserwujesz nagły wzrost liczby przesłanych treści w styczniu. Wzrost liczby przesyłanych plików dotyczy zwłaszcza przesyłanych obrazów. Jak myślisz, jaka będzie tego przyczyna i jak przetestujesz ten nagły skok? P16. Jesteś właścicielem firmy odzieżowej i chcesz poprawić swoją pozycję na rynku. Jak to zrobisz z poziomu gruntu? P17. W jaki sposób zdecydujesz, które wersje dwóch algorytmów cen wzrostowych działają lepiej dla dowolnej firmy lotniczej? P18. Jaki jest stopień swobody lassa? P19. Jaka jest różnica między iteratorem, generatorem i zrozumieniem list w Pythonie? Pytanie 20. Biorąc pod uwagę zestaw stron internetowych i zmiany w witrynie, w jaki sposób przetestujesz nową funkcję witryny, aby określić, czy zmiana działa pozytywnie? P21. Mając macierz wymiarów MxN z każdą komórką zawierającą alfabet, sprawdź, czy zawiera ciąg, czy nie. P22. Jak zbudujesz system buforowania przy użyciu zaawansowanej struktury danych, takiej jak hashmap? P23. Gdybyś mógł uzyskać zbiór danych na dowolny temat, który Cię interesuje, niezależnie od metod lub zasobów, to jak wyglądałby zbiór danych i co z nim zrobisz? P24. Jakie są metody wykrywania anomalii? P25. Jak działa buforowanie i jak go używasz w nauce o danych? Więc chłopaki, tym razem kończymy ten artykuł. Pytania do wywiadów Google Data Science dotyczą głównie oparty na scenariuszu i wymagam od ciebie Umiejętności rozwiązywania problemów a ponadto musisz wiedzieć, jak zastosować naukę o danych w takich sytuacjach. Mam nadzieję, że da ci to perspektywę przygotowania się do każdego wywiadu naukowego o danych w przyszłości. Czy to Google, Microsoft, Apple czy Uber. Wszyscy giganci technologii zadają podobne pytania, jeśli chodzi o naukę o danych, ponieważ jest to rozległa i jednocześnie nowa dziedzina. sprawia, że ​​jesteś biegły w narzędziach i systemach używanych przez Data Science Professionals. Obejmuje szkolenia z zakresu statystyki, nauki o danych, Pythona, Apache Spark & ​​Scala, Tensorflow i Tableau. Program nauczania został określony na podstawie szeroko zakrojonych badań obejmujących ponad 5000 opisów stanowisk na całym świecie. Jeśli masz jakieś pytania, możesz o nich wspomnieć w sekcji komentarzy poniżej.