10 nejčastějších dotazů na rozhovor s vědci z dat

Oblast datové vědy se neustále vyvíjí, zahrnuje několik odvětví a vyžaduje rozsáhlou sadu dovedností, která zahrnuje matematiku, statistiku, programování a marketing. Stát se datovým vědcem proto vyžaduje působivou směs technických dovedností, kreativity a komunikace.

Popisy práce pro vědce se mohou velmi lišit, i když všichni hledají kandidáty s dlouhým seznamem nejžádanějších pracovních dovedností, jako je kritické myšlení, řešení problémů, analýza dat, emoční inteligence, pozornost k detailům a týmová práce. To znamená, že otázky týkající se rozhovorů pro vědce s údaji mohou pokrývat několik různých témat a sahat od typických dotazů na měkké dovednosti až po extrémně technické diskuse.

Rozhovory s datovými vědami vyžadují hodně přípravy. Ať už jste čerstvý ze špičkové školy informatiky nebo se chystáte přejít do jiné společnosti nebo oboru, měli byste si udělat čas a projít hlavní pojmy své práce. Stejně jako víte, jak řídit, ale může mít potíže s předepisováním konkrétních pravidel silnice, můžete uvíznout v rozhovoru a pokusit se vyjádřit, jak konkrétní algoritmus funguje.

Abychom vám pomohli s přípravou, shromáždili jsme 10 nejčastějších dotazů s údajovými vědci. Od časných projekcí až po videonahrávky a pohovory ve druhé a třetí etapě a rozhovory na místě se setkáte s celou řadou zkoušek, jako jsou tyto vaše technické dovednosti, komunikační schopnosti a pracovní styl.

1. 'Řekněte nám více o nejnovějším projektu ve vašem portfoliu.'

Vědci o údaje jsou žádáni v mnoha různých průmyslových odvětvích, ale společnosti často hledají někoho, kdo má velmi specifické dovednosti a dobrou kulturu. Podrobné online portfolio zobrazující typ práce, kterou dokážete, stejně jako silná přítomnost na sociálních médiích a osobní značka, vám pomůže vyniknout od ostatních kandidátů a také vás spojí s najímáním manažerů a náborových pracovníků na místa, která jste dokonale vhodné pro.

Připravte se na jakýkoli rozhovor s údajovými vědci, abyste mohli rozsáhle hovořit o všech prvcích vašeho životopisu, portfolia nebo webové stránky. Upravte svou reakci na projekt tak, aby vyhovoval vašemu publiku. Pokud se jedná o úvodní projekci nebo panel s účastníky z různých oddělení, měli byste se zaměřit na to, jak vaše práce přinesla pozitivní výsledky pro klienta a jeho podnikání.

Když se dostanete do části procesu pohovoru, kde se setkáváte s jiným vědcem, inženýrem, analytikem nebo jinou technickou osobou, je vyžadován podrobnější popis dat a procesů zapojených do vaší práce.

2. "Proč chcete pracovat pro tuto společnost?"

I když vás kontaktovali přímo prostřednictvím vašeho online portfolia nebo profilu LinkedIn a pozvali jste na pohovor na otevřenou pozici, společnost bude chtít vědět, proč jste přijali a proč si myslíte, že budete pro tuto práci dobře hodeni.

Kromě prohloubení vašich technických dovedností by vaše příprava na pohovor měla zahrnovat výzkum týkající se firmy, na kterou se ucházíte. Informace o jejich oboru, poslání, osazenstvech, přesně to, co dělají a jak dobře se jim daří, vám pomohou vytvořit odpověď na tuto otázku přesně na míru.

Oslovte, jak jim vaše dovednosti pomohou splnit jejich cíle. Najděte způsob, jak vyjádřit vášeň pro jeden nebo více aspektů vaší pracovní pozice, včetně poslání společnosti, filozofie, inovací nebo produktové řady. Pokud je to vaše vysněná práce, může být vhodné si před pohovorem sestavit projekt datové vědy, který pro ně vyřeší problém - například odvolání se na nové demografické nebo naplánování dodávek efektivněji.

3. „Pojmenujte vědce, které nejvíce obdivujete, a vysvětlete proč.“

I když se jedná o velmi osobní otázku, která technicky nemá správnou odpověď, odpovědi, které vyberete, jsou velmi důležité. Váš výzkum o společnosti, stejně jako o průzkumech na panelu rozhovorů, vám může pomoci udělat dobrý první dojem pouze s touto otázkou.

Znát lidi, kteří jsou v oboru prominentní, stejně jako ti, kteří v současné době dělají vlny, ukáže tazatelům, že jste obeznámeni a jste nadšení z oboru. Je užitečné diskutovat o vědcích s údaji, kteří jsou oceněni v konkrétní kariéře, o kterou se ucházíte, jako jsou finance, medicína nebo akciový trh.

Tato otázka je víc než jen působivý seznam jmen. Část „proč“ v rovnici také ukáže vašim potenciálním zaměstnavatelům, co si ve svém oboru ceníte a jak budete přistupovat ke své práci. Pokud váš výzkum ukázal, že společnost oceňuje inovace, integritu nebo dokonce určitou statistickou metodu, je to skvělá příležitost, abyste jim řekli, že sdílíte stejné hodnoty.

4. "Jak byste vysvětlil doporučení motoru někomu z oddělení marketingu?"

Jednou z důležitých vlastností, která odlišuje vědce od dat od jiných technických génů, je schopnost převádět, zobrazovat a vysvětlovat data způsobem, kterému rozumějí netechničtí lidé. Díky tomu je dotaz jako tato jedna z nejdůležitějších otázek rozhovorů s vědci v oblasti dat, se kterými se setkáte. Tazatelé chtějí vidět, jak dobře můžete komunikovat koncepty, jako je modelování dat, rozhodovací stromy a lineární regrese, každému publiku.

V tomto konkrétním případě budete nejdříve chtít vysvětlit, jak funguje mechanismus doporučení, s příklady filtrování podle obsahu a filtrování založeného na spolupráci. Pak budete chtít prodiskutovat, jak můžete spolupracovat s marketingovým oddělením a spojit své dovednosti přitažlivosti pro zákazníky s výkonem algoritmu, který využívá shromážděná data, aby pomohl určit, co spotřebitelé chtějí.

5. „Jaké jsou rozdíly mezi učením pod dohledem a bez dozoru?“

Můžete začít shrnutím, že hlavní rozdíl mezi těmito dvěma je v tom, že supervidované učení má tréninková data, ze kterých se algoritmus může poučit a poskytnout odpovědi. Učení bez dozoru vyžaduje spíše seskupování věcí podle podobnosti, společných anomálií a dalších procesů vyhledávání vzorů, než podle tvrdých a rychlých dat.

Tazatel bude chtít, abyste šli do podrobností, takže je důležité uvést konkrétní rozdíly a být schopen mluvit o různých použitých algoritmech.

Dozorované učení

  • používá jako vstup známá a označená data
  • má mechanismus zpětné vazby
  • používá se pro předpověď
  • Mezi jeho běžné algoritmy patří rozhodovací strom, logistická regrese, lineární regrese, pomocný vektorový stroj a náhodná doménová struktura

Bez dozoru

  • používá neoznačená data jako vstup
  • nemá mechanismus zpětné vazby
  • používá pro analýzu
  • jeho běžné algoritmy zahrnují K-znamená klastrování, hierarchické klastrování, autoenkodéry a asociační pravidla

Budete chtít mít několik příkladů, ať už obecných, nebo z konkrétního projektu, na kterém jste pracovali, pro ilustraci rozdílů mezi těmito dvěma typy strojového učení a v jakých případech může být každý použit. Například učení bez dozoru může být použito při uvádění nového produktu na trh, kde není známa demografie zákazníka, na který by se mohl odvolat.

předplatit

Přihlaste se k odběru našeho zpravodaje a získejte úžasný obsah a získejte 20% slevu z naší kariérní zkoušky!

předplatit

6. „Jak se vyhnete zkreslení výběru?“

Tato otázka může mít v rozhovoru pro vědu o datu mnoho podob. Můžete být požádáni, abyste definovali zkreslení výběru, jak tomu zabránit nebo uvést konkrétní příklad toho, jak hrál roli v projektu, na kterém jste pracovali.

Hlavní problém se zkreslením výběru spočívá v tom, že byly vyvozeny závěry z náhodného vzorku. Nejjednodušším řešením je samozřejmě vybrat vždy náhodný vzorek jasně definované populace. Budete se muset zabývat tím, proč to není vždy možné.

Uvědomte si, že vzhledem k tomu, že výběrová předpojatost může být záměrná - s výběrem subjektu nebo s eliminací dat záměrně provedeným jako důkaz předsudky o teorii nebo projekci - mohlo by to být nepřímý způsob, jak by náborový panel mohl položit jednu z těchto náročných rozhovorových otázek o etice a integritě v práci .

Nakonec budete chtít zdůraznit, jak je výběrové zkreslení častěji případem neúmyslných nebo nevyhnutelně zkreslených údajů. Nezapomeňte podrobně rozebrat některé oblasti, ve kterých může dojít ke zkreslení výběru, včetně vzorkování, časového intervalu, dat a opotřebení. Poté uveďte několik příkladů, jak vám techniky práce, jako je převzorkování a zesílení, mohou pomoci při obcházení náhodných vzorků.

Pokud jste v rozhovoru se zástupci méně technických oddělení, použijte snadno stravitelný příklad, který jasně ilustruje zkreslení výběru. Vědec údajů Eric Hollingsworth odkazuje na lekci poučenou z ohniska ptačí chřipky v roce 2011, kde „ve statistickém vzorku„ potvrzených případů “bylo započítáno„ jen velmi nemocných jedinců “. Výsledná 80% hlášená míra úmrtnosti, tak hrozná z důvodu předpojatosti při výběru, vyvolala značný rozšířený strach.

7. „Jak lze zacházet s odlehlými hodnotami?“

Toto je běžný dotazovací rozhovor pro vědce s údaji, protože odhaluje, jak používáte data, která jste dostali, metody, které používáte ke zpracování těchto dat, a zda jste ochotni dát čas na vyhodnocení každého z těchto údajů.

Nejprve budete chtít mluvit o tom, co představuje odlehlou hodnotu, jako čísla, která existují mimo skupinu dat v grafu, jako 2–3 standardní odchylky od střední hodnoty atd. Dalším krokem k řešení odlehlých hodnot je hodnocení, proč k nim došlo.

Malé množství odlehlých hodnot, které lze připsat jednoduché lidské nebo strojové chybě, lze snadno odstranit. Nezapomeňte však, že i jediný odlehlý bod může být spíše klíčovým datovým bodem než problémem, protože to může znamenat úspěch jedné marketingové taktiky, nové složky léčiv nebo produktové řady.

Dále budete chtít vysvětlit, jak se vypořádat s velkým počtem odlehlých hodnot, což vyžaduje složitější řešení. Možná budete muset změnit model, který používáte, normalizovat data na průměr nebo použít náhodný doménový algoritmus. Znovu se pokuste použít skutečný případ z vaší zkušenosti jako vědec údajů k vysvětlení správné taktiky.

8. „Proč je čištění dat důležité?“

Sběr a čištění dat je dominantní součástí vaší práce jako vědec s údaji, což zabírá až 80% času. Ať už se nacházíte v jakémkoli průmyslovém odvětví, otázky z pohovoru budou vždy zahrnovat otázku, proč je čištění dat důležité. Tazatelé se také zeptají na vaše preferované očistné techniky a programy.

Měli byste zdůraznit, jak čistá data jsou nutná k tomu, aby bylo možné vyvodit správné závěry, ale nejde jen o čísla. Vysvětlete, jak začít s úplnými, přesnými, platnými a jednotnými údaji přímo ovlivňuje jejich podnikání. Mezi hlavní výhody, o nichž se má diskutovat, patří:

  • lepší rozhodování o cílech společnosti
  • rychlejší získávání zákazníků a přesměrování minulých zákazníků
  • úspora času a zdrojů díky eliminaci nepřesných nebo duplicitních dat
  • zlepšená produktivita
  • posílená morálka týmu díky opakovaným efektivním a přesným výsledkům

9. „Co je cílem testování A / B?“

Otázky týkající se testování A / B během pohovoru na pozici vědce údajů mohou začít obecnějším odkazem na použití experimentálního návrhu k zodpovězení jediného dotazu na chování nebo preference uživatelů. Cílem testování proměnné designu webových stránek, aplikací nebo bulletinů je zcela jednoduše posoudit, zda změna zvýší úrok, míru zapojení a míru konverze.

Jedním ze způsobů, jak se odlišit při zodpovídání těchto typů otázek na rozhovor, je diskutovat o tom, jak by ostatní vědci v oblasti dat mohli vyvodit nesprávné závěry z testování A / B. Možné úskalí zahrnují:

  • neshromažďování dostatečného množství dat po dostatečně dlouhou dobu
  • testování příliš mnoha proměnných najednou
  • neúčtování vnějších faktorů, které mohou ovlivnit provoz během testovacího období
  • ignorování malých zisků, které se mohou časem vytvářet a kombinovat s dalšími pozitivními změnami za účelem zvýšení příjmů
  • chybí interpretace velkého obrazu, jako jsou čisté finanční zisky nebo ztráty vzhledem k přepočítacím koeficientům

Kromě poukazování na tyto problémy budete muset vyjádřit, jak byste je vyřešili - nebo ještě lépe, jak jste se jim již vyhnuli ve svých předchozích projektech v oblasti vědy o údajích.

10. 'Máte 48 hodin na vyřešení tohoto problému s kódováním.'

Výzvou pro kódování může být úvodní způsob, jak prověřit potenciální vědce v oblasti dat, nebo to může být druhý krok v procesu pohovoru poté, co jste odstranili první překážku u náborového pracovníka nebo vedoucího náboru. Může to být test na místě, který trvá 30 minut až 2 hodiny, kde budete kódovat na tabuli nebo na klávesnici v pohledu na tazatele. Často dostáváte výběr jazyka, ale buďte připraveni kódovat v SQL nebo Pythonu.

Některé společnosti zadávají delší úkoly s lhůtami až týden. Problémy s tabulemi mohou vyžadovat psaní poměrně jednoduchých dotazů SQL, ale delší testy jsou samozřejmě složitější. Obvykle obdržíte data a budete požádáni, abyste pomocí těchto údajů provedli konkrétní předpovědi, a budete muset ukázat svou práci. Například nedávný subjekt rozhovoru s vědci v oblasti dat obdržel data Airbnb a požádal, aby předpovídal ceny domů na základě ubytovacích funkcí.

Tazatelé budou chtít s vámi prodiskutovat vaše rozhodnutí, předpoklady, které jste učinili, funkce, které jste vybrali, proč jste použili určité algoritmy a další. Odpověď, na kterou narazíte, je často méně důležitá než váš proces, kreativita, čitelnost kódu a design.

Může to být zážitek z rozhovoru s nervy, takže se připravte tím, že vytvoříte a dokončíte praktické kódování problémů s přáteli nebo kolegy v oblasti datové vědy. Můžete také navštívit stránky jako Leetcode a SQLZOO za účelem kódování. Skutečné falešné rozhovory týkající se algoritmických problémů a problémů s návrhem systémů jsou k dispozici zdarma na Interviewing.io.

Jak vidíte, otázky týkající se rozhovorů pro vědce s údaji mohou být obtížné a celkový proces může být zdlouhavý a vyčerpávající. Jedním z nejdůležitějších tipů na rozhovor je zůstat pozitivní, i když máte pocit, že část procesu pohovoru šla špatně. Jsme na sobě často těžší než ostatní a vy můžete stále přistát v práci, i když nedostanete každou odpověď tak dokonalou, jak by se vám líbilo.

Pokud vám tato příležitost chybí, požádejte o zpětnou vazbu a využijte ji ke zlepšení příštího rozhovoru. Koneckonců, mnoho zavedených datových vědců bylo odmítnuto z několika pozic a stále pokračovalo k úspěchu v pracovních pozicích, které nakonec byly lepší.

S jakými otázkami a problémy s kódováním jste se setkali, když jste se pokusili přistát v práci s údaji? Připojte se k diskusi v komentářích níže a pomozte svým kolegům vědcům s údaji připravit se na další rozhovor!

Zanechte Svůj Komentář

Please enter your comment!
Please enter your name here