Hur du granskar datavetenskapliga färdigheter

Publicerad: Senast uppdaterad:
Skärm datavetenskapskompetens

Datavetenskap. Ett modernt modeord. I vår digitala värld är det vanligt att man hittar titlar på roller och discipliner som ännu inte är allmänt definierade och accepterade. Ingen är mer så utbredd än datavetenskap och de datavetenskapliga färdigheter som tillskrivs dem.

I den här artikeln kommer vi att förklara innebörden av datavetenskap och datavetenskapliga färdigheter och ge dig våra råd om hur du bäst söker efter en tjänst inom datavetenskap.

Nedre gränsvärden för datavetenskap

Enligt marknadsundersökningsföretaget Forrester kommer insiktsdrivna företag år 2021 att vara totalt sett värt $1,8 biljoner euro, vilket är en ökning från $333 miljarder år 2015. Dessa "insikter" kommer från data som spelar en central roll för att hjälpa världens mest framgångsrika företag att bli mer lönsamma. I samma rapport konstaterades att datadrivna organisationer växer 8 gånger snabbare än den globala BNP:n. Mat till eftertanke.

Förmågan att tolka data och utnyttja deras användbarhet är uppenbarligen en ganska seriös uppgift. Men det råder mer eller mindre konsensus om följande om bristen på samförstånd om en tydlig definition av datavetenskap.

Trots att området har svårt att definiera sig självt har det inte hindrat skapandet av nya forskarutbildningar. med "datavetenskap" i sina namn. För att bekräfta detta kan en nyligen genomförd undersökning av KDNuggets visar att examen med namnet "datavetenskap" började dyka upp 2007, med en enorm ökning av antalet inskrivningar 2012.

Det är uppenbart att datavetenskapliga tjänster befinner sig på en kritisk bana i sin livstid. På grund av fältets skalbarhet får det den uppmärksamhet det kräver. Men hur ska vi kunna anställa för det om vi inte kan förstå vad det är?

DevSkiller täcker dig på båda fronterna.

Vad är datavetenskap?

Vad är datavetenskap?

I sin enklaste form är datavetenskap en disciplin som går ut på att göra data användbara. Begreppet datavetenskap är "att förena statistik, dataanalys, maskininlärning"., och relaterade metoder" för att "förstå och analysera faktiska fenomen" med hjälp av data.

Traditionellt sett var de data vi kunde utvärdera oftast strukturerade och små till storleken och kunde analyseras med hjälp av enkla BI-verktyg. Till skillnad från data i de traditionella systemen som mestadels var strukturerade, I dag är de flesta data ostrukturerade eller halvstrukturerade. Denna efterfrågan har gjort att datavetenskapsmannen har fått en allt viktigare roll.

1.1 Vad är datavetenskapsmannens roll?

En datavetare bör fastställa företagets datastrategi, vilket innebär att allt från teknik och infrastruktur för insamling av data och loggning till integritetsfrågor. De bestämmer vilka data kommer att vara användarvänliga, hur data kommer att användas för att fatta beslut och hur de kommer att byggas in i produkten. De kommer också att ägna sig åt patentering av innovativa lösningar och fastställande av forskningsmål. En lista över deras grundläggande ansvarsområden omfattar följande:

  • Sammanställning av all tillgänglig information, statistik och data om en organisation,
  • Sammanställning av information om AI-behoven i en organisation,
  • Analysera data och hitta potentiella användningsområden med hjälp av AI (ibland kallad explorativ dataanalys),
  • Förklara datamönster för affärsorienterade kollegor och kunder (en process som kallas data storytelling),
  • Utforma och förbereda modeller för maskininlärning,
  • Utvärdera modellernas effektivitet i produktionsmiljön.

Om du inte visste det, är en modell för maskininlärning ett program som har tränade att känna igen vissa typer av mönster. Det är möjligt att träna en modell på en uppsättning data och ge den en algoritm som den kan använda för att resonera om och lära sig av dessa data.

En chefsdataforskare bör leda ett team av ingenjörer, forskare och analytiker och kommunicera med ledningen i hela företaget, inklusive vd, teknikchef och produktledning. Hon ska också ägna sig åt att patentera innovativa lösningar och fastställa forskningsmål.

En populär Twitter Definitionen har beskrivit en datavetare som "någon som är bättre på statistik än någon programvaruingenjör och bättre på programvaruteknik än någon statistiker".

1.2 Är en datavetare likadan som andra tjänster?

Många olika typer av analytiker kan "göra data användbara", från datatekniker till datatekniker, hela vägen till en kvalitativ expert. Alla dessa roller ingår i datavetenskap, men för att någon ska kunna kallas datavetare bör han eller hon ha expertis inom alla tre områdena (analys, statistik och ML/IA).

För att ge ett exempel: en utvecklare av maskininlärning utför en delmängd av datavetenskapsmannens uppgifter men fokuserar endast på modeller för maskininlärning. Datavetare är verkligen ett paraplybegrepp, även om yrkestitlar aldrig riktigt har varit en korrekt återspegling av personens ansvarsområden.

Datavetenskap: Vad är viktigt för en IT-rekryterare?

Vad är viktigt för en IT-rekryterare att veta om datavetenskap?

2.1 Hur ofta förändras miljön/utmaningarna?

En sak som en IT-rekryterare bör notera är att landskapet ständigt förändras. Uppgifterna blir större och problemen svårare, så nya tekniker utvecklas och nya ramar kommer garanterat att följa.

2.2 Finns det många resurser/verktyg/tekniker (bibliotek, ramverk osv.) tillgängliga?

Att känna till vissa resurser och verktyg är säkert en stor fördel. För närvarande finns det många verktyg tillgängliga i Python, men det finns betydligt färre tillgängliga för R (ett annat programmeringsspråk). Vissa ramverk för djupinlärning finns tillgängliga i C++, eftersom det är snabbare och mer minneseffektivt än Python. I Python omfattar några av de mest populära biblioteken: pandas, Seaborn, plotly, scikit-learn, PyTorch, TensorFlow.

2.3 Vad bör en datavetare känna till och vilka är de viktigaste färdigheterna för datavetare?

Datavetare förväntas kunna mycket - maskininlärning, datavetenskap, statistik, matematik, datavisualisering, kommunikation och djupinlärning. Inom dessa områden finns det dussintals språk, ramverk och tekniker som datavetare kan lära sig.

Datavetenskap kräver kunskaper i statistik och datavetenskap - det är ingen överraskning. Det är intressant att kommunikation nämns i Nästan hälften av alla jobbannonser inom datavetenskap i dessa dagar. Datavetare måste kunna kommunicera insikter och samarbeta med andra. Nedan följer en grundläggande lista över vad som gör en bra datavetare till en bra datavetare:

  • Förmåga till dataanalys
  • Skicklig inom maskininlärning
  • Har god kommunikationsförmåga.
  • behärskar ett ramverk för djup inlärning
  • behärskar Python eller R

2.4. Vilken typ av erfarenhet är viktig att leta efter hos en datavetare (kommersiell, öppen källkod, vetenskaplig, akademisk)?

När det gäller forskning, endast projekt - akademisk eller vetenskaplig erfarenhet kommer att vara den mest avgörande och väl avrundade. När det gäller att skapa produktionsmodeller är det dock tidigare erfarenhet av att arbeta med andra produktionsmodeller som ger dig den bästa insikten.

Kontrollera färdigheter

Hur verifierar man datavetare i screeningfasen?

Växande data innebär växande möjligheter - allt behöver bara hanteras på ett bra sätt. Det är svårt att verifiera kompetensen i screeningfasen, men fokusera på kandidatens mjuka färdigheter kan också hjälpa till att hitta talanger på ett unikt sätt. Hitta datavetare som redan är bra beslutsfattare.

Makare kan spara mycket krångel för ditt företag.

3.1 Vad ska man ta hänsyn till när man granskar ett CV?

Det viktigaste är om kandidaten har en detaljerad bakgrund inom de mest relevanta områdena. En historia av exponering för matematik, statistik, datavetenskap, programmering och bibliotek för maskininlärning är helt avgörande här. Tidigare erfarenhet av datavetenskapliga analyser och programmering är också avgörande.

Det som skiljer en bra datavetare från en bra datavetare är den interpersonella kommunikationsförmågan, dvs. förmågan att samtala och samarbeta med många olika människor. Kandidaten bör också ha en god affärsmässighet eller en väl avvägd förståelse för affärsmässiga grunder och principer.

Se till att kontrollera om kandidaten har angett hur deras arbete har påverkat en ökning av försäljningen, avkastningen på investeringar etc. Det är mycket viktigt för toppkandidater att inkludera kvantitativa bevis för sina prestationer.

Om kandidaten du söker är nyutexaminerad kan du fokusera på deras färdigheter och relevanta kurser eller praktikperioder som de kan ha gjort för att bedöma deras kunskapsbredd.

3.2 Vilka termer i ordlistan är viktiga att känna till?

  • Utforskande dataanalys - består av rensning av data, utforskning av datamönster och manuell upptäckt av mönster i data.
  • Data storytelling - detta avser beskrivning och visualisering av datamönster för personer utan teknisk kunskap.
  • Klassisk maskininlärning - lösa uppgifter med hjälp av modeller som linjär eller logistisk regression, beslutsträd, slumpmässiga skogar, boosting, stödvektormaskiner, faktorisering av icke-negativa matriser, K-means, k-nearest neighbors.
  • Djupinlärning - att lösa uppgifter med hjälp av neurala nätverk. Några typer av neurala nätverk är konvolutionella neurala nätverk och återkommande neurala nätverk.
Bibliotek för dataanalys och databehandlingI Python: I R: dyplr, tidyr
Bibliotek för distribuerad dataanalys och databehandlingI Python: Dask i Scala, Java och Python: Spark
Bibliotek för datavisualiseringI Python: Seaborn, Plotly, Matplotlib I R: ggplot2
Allmänna bibliotek för maskininlärningI Python: scikit-learn I R: caret, e1071
Bibliotek för djupinlärningI Python: Keras, Tensorflow, PyTorch I R: Nnet I C++: Caffe

3.3 Vilka certifieringar finns tillgängliga och respekteras? Hur användbara är de när det gäller att fastställa datavetarexpertisens kompetens?

Låt oss klargöra en sak på förhand: du behöver inte ha något certifikat för datavetenskap för att få ett jobb inom datavetenskap. Det hjälper, men rekryterare är inte särskilt intresserade.

Ungefär hälften av kunskapen om maskininlärning är dock teoretisk, så certifieringar inom detta område är mycket användbara. Den andra delen, 50%, kommer från erfarenhet, dvs. alla typer av produktionsmodeller som skapats eller Kaggle-tävlingar. Certifieringar kontrollerar vanligen inte affärsanalysförmåga eller allmänna mänskliga färdigheter. De bästa kurserna som vi har hittat finns nedan.

  • Certifierad analytiker (CAP)
  • Cloudera Certified Associate: Data Analyst
  • Cloudera Certified Professional: CCP Data Engineer
  • Data Science Council of America (DASCA) Senior Data Scientist (SDS)
  • Data Science Council of America (DASCA) Principle Data Scientist (PDS)
  • Dell EMC Data Science Track
  • Google Certified Professional Data Engineer
  • Google Data och maskininlärning
  • IBM Data Science Professional-certifikat
  • Microsoft MCSE: Datahantering och analys
  • Microsoft Certified Azure Data Scientist Associate
  • Open Certified Data Scientist (Open CDS)
  • SAS Certified Advanced Analytics Professional
  • SAS Certified Big Data Professional
  • SAS-certifierad datavetare

Certifieringar från Coursera, edX eller Udacity är också mycket uppskattade.

3.4 Vilka andra rader på ett CV kan visa på datavetenskapliga färdigheter?

Om du noterar kandidaternas deltagande i konferenser som talare kan det visa på en nödvändig färdighet för att kunna berätta bra historier, vilket är ett viktigt krav inom datavetenskap. Det är naturligtvis absolut nödvändigt att vara expert på den tekniska sidan av saker och ting, men att ha förmågan att förklara sina resultat för dem som inte har dina tekniska kunskaper är lika avgörande.

Att delta i tävlingar om maskininlärning kan också vara en stor fördel. Plattformar som Kaggle.com, topcoder.com, crowdai.org och knowledgepit.ml ger alla möjlighet att tävla om priser inom området.

I dagens värld räcker det kanske inte med ett bra CV för att få den eftertraktade intervjun. Särskilt om du söker en roll som datavetare. Eftersom vi lever och frodas mitt i en digital revolution är det logiskt att rekryteringsprocessen också omfattar detta.

Det kan vara bra att titta på en kandidats LinkedIn- och GitHub-konton för att bedöma kandidatens profil och för att se hur skicklig han eller hon är i projekt med öppen källkod. Du kan avgöra om projekten är relevanta för den aktuella rollen. Detta hjälper dig att visualisera kandidatens profil så att du kan strukturera frågorna på ett visst sätt. Du kan också avgöra om de datavetenskapliga färdigheter som kandidaten nämner i sitt CV återspeglas i deras GitHub-profil.

Teknisk screening av datavetenskapliga färdigheter under en teknisk intervju per telefon/video.

Det är svårt att bara lita på orden i ett CV. Det är trots allt viktigt att utmana kandidaten för att avgöra om han eller hon verkligen har de färdigheter som han eller hon påstår sig ha. Även om det bara är en telefonintervju kan den hjälpa dig att förstå hur kandidaten tänker och går tillväga för att lösa problem som rör deras yrke.

4.1 Frågor som du bör ställa om en datavetares erfarenhet. Varför ska du ställa var och en av dessa frågor?

  • Vilken typ av DS-projekt genomförde du, och i vilken utsträckning var du engagerad i projekten?
    Skäl: Vissa kandidater kanske bara arbetar med dataanalys och storytelling eller bara samlar in krav och skapar modeller för maskininlärning. Kandidatens erfarenhet bör matcha ansvarsområdena för den tjänst du rekryterar till. Den här frågan syftar egentligen till att kontrollera omfattningen av kandidatens färdigheter.
  • Hur har ditt arbete haft en positiv ekonomisk inverkan på organisationen i de projekt du deltagit i?Skäl: Det krävs en god förståelse för verksamhetens krav och villkor för att kunna arbeta som datavetare. Leta efter svar som visar specifika mätningar, till exempel "marknadsföringsteamet kunde minska kostnaderna med 10% tack vare våra resultat" eller "vi har minskat kundomsättningen med 5% tack vare vår nya förmåga att behålla kunder".
  • Vilka typer av bibliotek och programmeringstekniker använde du?
    Skäl: Datavetare kan använda många olika verktyg för att uppnå samma resultat. Dessa kan bero på vilket programmeringsspråk man väljer, företagets interna infrastruktur och storleken på den datamängd som kandidaten har arbetat med. Kandidaten kommer sannolikt att prestera bäst med verktyg som han eller hon har tidigare erfarenhet av.

4.2 Frågor som du bör ställa om en datavetares Kunskaper och åsikter.. Varför ska du ställa var och en av dessa frågor?

  • Hur kan du kontrollera att en modell fungerar som den ska?
    Skäl: Den idealiska metoden är att dela upp datasetet i delar: träningsuppsättning, valideringsuppsättning och testuppsättning. Träningsuppsättningen är den enda som modellen har tillgång till och utgör grunden för träningsprocessen. Modellens parametrar fastställs med hjälp av valideringsuppsättningen och modellens effektivitet testas på testuppsättningen.
  • Hur kan du kontrollera att uppgifterna i datasetet är av god kvalitet?
    Skäl: En datavetare kommer troligen att behöva arbeta med ett dataset som samlats in inom företaget och som kan innehålla saknade värden, fel eller inkonsekvenser - detta är tecken på röriga data. För att hitta sådana problem bör en datavetare utföra en explorativ dataanalys för att sammanfatta deras viktigaste egenskaper.
  • Vad är boosting och vilka är fördelarna med att använda det?
    Motivering: Förstärkningsmodeller är trädbaserade modeller som består av grupper av träd som tränas i följd. Förstärkningsmodeller är för närvarande de mest effektiva modellerna med stor noggrannhet, relativt korta träningstider, minskad minnesanvändning och medelstora träningsdatamängder (i jämförelse med tekniker för djupinlärning).

Ett tips från vår expert är att ställa frågor som är relaterade till de affärsproblem som du för närvarande rekryterar för. Precis som alla andra arbetar datavetare bäst inom områden som de är bekanta med.

Det är till exempel inte alla kandidater som har en känsla för (eller är intresserade av eller vill lära sig) hur fabriksutrustning fungerar (problem med förebyggande underhåll), medicinska termer (skapande av AI för den medicinska industrin) eller kundpreferenser (rekommendationssystem för e-handel).

4.3 Beteende frågor som du bör ställa till en datavetare. Varför ska du ställa var och en av dessa frågor?

  • Hur hanterar du meningsskiljaktigheter med kollegor?
    Skäl: En datavetare måste ha goda kommunikations- och interpersonella färdigheter (t.ex. empati) eftersom deras roll bygger på att sammanställa data från kollegor och hitta områden som kan förbättras inom organisationen eller samhället.
  • Var hittar du information om nya datavetenskapstekniker eller fall?
    Skäl: Eftersom datavetenskap ständigt utvecklas och växer kräver rollen ständig forskning för att hålla sig uppdaterad om de senaste uppdateringarna och för att lösa problem på det mest effektiva sättet. Alla dessa källor är värda: konferenshandlingar, workshophandlingar, MOOCs, bloggar från företag som arbetar med datadata, möten med datadatasamfundet, Facebook- eller mailgrupper med ett datadatatema, eller att lära sig av en mentor.
  • Vad anser du vara din största framgång och ditt största misslyckande inom DS-området?
    Skäl: Det här är en ganska allmän fråga, men den visar kandidatens förmåga till självkännedom och självreflektion. Båda är nödvändiga i inlärningsprocessen, som är en viktig del av att vara en bra datavetare.
Kodningsprov

Teknisk screening av en datavetares färdigheter med hjälp av ett kodningstest online.

Att anställa en datavetare kan vara en komplicerad process. Den egentliga definitionen av en datavetare är vag, och det dagliga arbetet för en person som har "datavetare" i sin yrkestitel varierar dramatiskt mellan olika organisationer. Dessutom kommer människor till området från en mängd olika bakgrunder. Att undersöka en datavetare-kandidats förflutna är en vetenskap i sig, en vetenskap som är värd ett eget blogginlägg. Vi håller oss till att visa hur du bäst söker efter en datavetare!

5.1 Vilket onlinetest för datavetare ska du välja?

När du letar efter rätt Test av datavetenskapliga färdigheter bör du se till att den uppfyller följande kriterier:

  • Testet återspeglar kvaliteten på det yrkesmässiga arbete som utförs.
  • Det är inte alltför lång tid, högst en till två timmar.
  • Testet kan skickas automatiskt och är enkelt till sin natur.
  • Svårighetsnivån motsvarar kandidatens förmåga.
  • Testet går längre än att kontrollera om lösningen fungerar - det kontrollerar kodens kvalitet och hur väl den fungerar i randfall.
  • Den ligger så nära den naturliga programmeringsmiljön som möjligt och ger kandidaten tillgång till relevanta resurser.
  • Det ger kandidaten möjlighet att använda alla bibliotek, ramverk och andra verktyg som de regelbundet stöter på.

5.2 DevSkiller färdiga online-tester för datavetenskapliga färdigheter som är redo att användas

DevSkillers kodningstester använder vår RealLifeTesting™-metodik för att spegla den faktiska kodningsmiljön som din kandidat arbetar i. I stället för att använda obskyra algoritmer kräver DevSkiller-testerna att kandidaterna bygger applikationer eller funktioner. De betygsätts helt automatiskt och kan genomföras var som helst i världen. Samtidigt har kandidaten tillgång till alla resurser som de normalt skulle använda, inklusive bibliotek, ramverk, StackOverflow och till och med Google.

Företag använder DevSkiller för att testa kandidater med hjälp av sin egen kodbas var som helst i världen. För att göra det enkelt erbjuder DevSkiller också ett antal färdighetstester för datavetenskap som de här:

Python
MIDDLE
Testade färdigheter
Varaktighet
70 minuter max.
Utvärdering
Automatisk
Översikt över testet

Frågor om valmöjligheter

bedömning av kunskaper om Python, Gnista

Programmeringsuppgift - Nivå:

Python | PySpark | Customer Preference Model - Implementera en datateknisk applikation för förbehandling av marknadsföringsdata.

Python
JUNIOR
Testade färdigheter
Varaktighet
65 minuter max.
Utvärdering
Automatisk
Översikt över testet

Frågor om valmöjligheter

bedömning av kunskaper om Python

Programmeringsuppgift - Nivå:

Python | PySpark | ML Logs Transformer - Slutföra genomförandet av loggtransformationsledningen.

Scala
JUNIOR
Testade färdigheter
Varaktighet
66 minuter max.
Utvärdering
Automatisk
Översikt över testet

Frågor om valmöjligheter

bedömning av kunskaper om Scala

Programmeringsuppgift - Nivå:

Scala | Spark | ML Logs Transformer - Slutföra genomförandet av loggtransformationsledningen.

Datavetenskap
JUNIOR
Testade färdigheter
Varaktighet
45 minuter max.
Utvärdering
Automatisk
Översikt över testet

Uppgift - Nivå:

SQL | Frimärkskatalog | De tre högsta priserna - Välj tre frimärken (pris och namn) med det högsta priset.

Programmeringsuppgift - Nivå:

Python | Pandas | HTML table parser - Implementera en funktion för att konvertera HTML-tabeller till en CSV-fil.

Python
JUNIOR
Testade färdigheter
Varaktighet
35 minuter max.
Utvärdering
Automatisk
Översikt över testet

Frågor om valmöjligheter

bedömning av kunskaper om Python

Programmeringsuppgift - Nivå:

Python | Pandas | HTML table parser - Implementera en funktion för att konvertera HTML-tabeller till en CSV-fil.

Python
MIDDLE
Testade färdigheter
Varaktighet
120 minuter max.
Utvärdering
Automatisk
Översikt över testet

Frågor om valmöjligheter

bedömning av kunskaper om Python

Programmeringsuppgift - Nivå:

Python | Rapport om fordonsförsäljning - Implementera en applikation för att skapa rapporter baserade på datalagret för fordonsförsäljning.

Python
MIDDLE
Testade färdigheter
Varaktighet
96 minuter max.
Utvärdering
Automatisk
Översikt över testet

Frågor om valmöjligheter

bedömning av kunskaper om Python

Programmeringsuppgift - Nivå:

Python | Pandas | Ett nystartat företag som levererar mat - Förvandla en databas med beställningar genom att minska dess dimensionalitet och skapa ytterligare en analytisk tabell.

Python
JUNIOR
Testade färdigheter
Varaktighet
45 minuter max.
Utvärdering
Automatisk
Översikt över testet

Frågor om valmöjligheter

bedömning av kunskaper om Python

Programmeringsuppgift - Nivå:

Python | Client Base Creator - Implementera programmet för att hämta kundens kontaktuppgifter från chattmeddelanden.

Python
MIDDLE
Testade färdigheter
Varaktighet
70 minuter max.
Utvärdering
Automatisk
Översikt över testet

Frågor om valmöjligheter

bedömning av kunskaper om Maskininlärning, Python

Programmeringsuppgift - Nivå:

Python | DNA Analyzer | Skapa och rengöra DNA-strängar - Implementera två metoder i Python som skapar och rengör DNA-strängar.

Python
JUNIOR
Testade färdigheter
Varaktighet
49 minuter max.
Utvärdering
Automatisk
Översikt över testet

Frågor om valmöjligheter

bedömning av kunskaper om Maskininlärning

Programmeringsuppgift - Nivå:

Python | DNA Analyzer - Implementera en metod i Python som genererar en statistisk DNA-rapport.

Dela inlägg

Läs mer om rekrytering av tekniker

Prenumerera på vår Learning Hub för att få nyttiga insikter direkt i din inkorg.

Kontrollera och utveckla kodningsfärdigheter utan problem.

Se DevSkillers produkter i praktiken.

Säkerhetscertifieringar och efterlevnad. Vi ser till att dina data är säkra och skyddade.

DevSkillers logotyp TalentBoost logotyp TalentScore-logotyp