Sentimentanalyse i Excel! Det er et gratis tillegg fra Microsoft Labs som lar deg gjøre sentimentanalyser i Excel. Hva om du må gå gjennom hundrevis av undersøkelseskommentarer for å se hva folk synes om firmaet ditt? Excel kan tilordne en sannsynlighet som viser hvor positiv eller negativ hver kommentar er.
Se på video
- Det er enkelt å kvantifisere undersøkelsesdata når det er flervalg
- Du kan bruke en pivottabell for å finne ut hvor mange prosent hvert svar har
- Men hva med friformsvar? Disse er vanskelige å behandle hvis du har hundrevis eller tusenvis av dem.
- Sentimentanalyse er en maskinbasert metode for å forutsi om svaret er positivt eller negativt.
- Microsoft tilbyr et verktøy som gjør sentimentanalyse i Excel - Azure Machine Learning.
- Tradisjonell sentimentanalyse krever at et menneske analyserer og kategoriserer 5% av uttalelsene.
- Tradisjonell sentimentanalyse er ikke fleksibel - du vil bygge ordboken på nytt for hver bransje.
- Excel bruker MPQA subjektivitetsleksikon (les om det på http: // bit. Ly / 1SRNevt)
- Denne generiske ordboken inneholder 5097 negative og 2533 positive ord
- Hvert ord tildeles en sterk eller svak polaritet
- Dette fungerer bra for korte setninger, for eksempel tweets eller Facebook-innlegg
- Det kan la seg lure av dobbeltnegativer
- For å installere, gå til Sett inn, Excel Store, søk etter Azure Machine Learning
- Spesifiser et inngangsområde og to tomme kolonner for utgangsområdet.
- Overskriften for inndataområdet må samsvare med skjemaet: tweet_text
- Ledsagerartikkel på: http://sfmagazine.com/post-entry/may-2016-excel-sentiment-analysis/
Videoutskrift
Lær Excel fra Podcast, episode 2062: Sentimentanalyse i Excel
Å hei, det var en høsttakkefest og vi satt rundt gresskarpai og Jes, vår venn, begynte å snakke om å gjøre sentimentanalyse på Twitter-data. Og jeg sa: "Hei, du vet at Excel har en måte å gjøre sentimentanalyser på." Og jeg skjønte at jeg ikke hadde en god video på denne eller noen video på dette, så denne videoen handler om å gjøre sentimentanalyse i Excel.
Nå er det første spørsmålet, hva pokker er sentimentanalyse? Og hvis du gjør en undersøkelse av kundene dine og de har et flervalgsvalg der de kan velge fra 1 til 5, vel, det er veldig, veldig enkelt å analysere. Du kan bare lage en liten pivottabell: Sett inn pivottabell, Eksisterende regneark her, klikk OK. Vi vil vite spørsmålet der eller svaret på spørsmålet, og så hvor mange svar det var på hver enkelt, og det gir oss det absolutte tallet. Du kan til og med komme inn her og endre dette fra feltinnstillinger til Vis verdier som% av kolonnetotalen, slik.
Greit, så du kan se for hvert svar hvor stor prosentandel av folket som får svar. Greit, men følelsesanalyse er for når du har et veldig langt svar der du sier: "Hei, ok, du vet, fortell oss hvorfor du ga oss det svaret?" Og de, du vet, bruker setninger eller avsnitt. Vel, hvis du har hundrevis eller tusenvis av disse, er det veldig vanskelig for noen å gå gjennom det og lese dem alle og finne ut hva som skjer, ok?
Så det er to forskjellige typer sentimentanalyser. Vanligvis vil du tidligere bruke en menneskelig overvåket læringsalgoritme. Så hvis du hadde 5000 svar, gå gjennom, du vet, 200 av disse og velg positive og negative ord og uttrykk. Du bygger i hovedsak en ordbok med positive og negative ord; men du vet, dette var veldig begrensende. Hvis du gjorde dette for et sted som reparerte bil og deretter hadde en annen kunde, vet du, som gjorde tepperens, de to ordbøkene er helt forskjellige. Du må gjøre maskinlæringen eller den menneskelige veiledningen om og om og om igjen. Så, Excel bruker denne tingen som kalles MPQA-subjektivitetsleksikonet, og du kan google dette. Den har informasjonen om den - 5.097 negative ord, 2533 positive ord. Og så,det fungerer bra for korte setninger eller tweets eller Facebook-innlegg. Men en ting jeg har lagt merke til er at hvis noen skriver i dobbeltnegativer, kan jeg ikke si at jeg ikke hater denne funksjonen, vel, maskinlæringen vil mislykkes der. Og pokker, jeg mislykkes. Jeg kan ikke si om de er glade eller ikke.
Ok, så her er hva vi gjør. I Excel 2013 eller Excel 2016, gå ut til Sett inn-fanen, gå til Store når søkeboksen kommer opp, søk etter Azure Machine, og du får Azure Machine Learning akkurat der. Vi klikker på Legg til. Greit, og to forskjellige verktøy her ute: Titanic Survivor Predictor, som er morsomt; og, Text Sentiment analyse Excel Add-in. La oss bruke den. OK, her er et par ting som vil snuble i deg. Din overskrift: Ta et avsnitt for å forklare svaret ditt. Det må matche skjemaet og skjemaet sier at overskriften må si tweet_text. Så her oppe: tweet_text, selvfølgelig, store og små bokstaver. Og lukk deretter skjemaet, og deretter Forutsi, Input: A1 til 100, My data has headers, Output: DataB1, Inkluder headers. De kommer til å gi oss to kolonner.Forsikre deg om at du har to tomme kolonner der; ellers vil det overstyre dataene. Du har to valg: Noen få rader om gangen eller Som en batch. Dette er bare hundre, så det spiller ingen rolle. Jeg vil velge Predict og BAM! Bare så fort.
Greit nå, vi får to kolonner: vi får en følelse og en score, ok. Så la oss representere poengene her som prosentandeler med en haug med desimaler. Greit, så 47,496, dette går fra 0 til 100%. Nærmere 100 er ekstremt positive, nær 0 er ekstremt negative, ok? Så her har vi en der det er et mindre problem, gjør meg gal. Finner ikke løsningen, så du kan se hvorfor det blir vurdert som ekstremt negativt. La oss se på en som kommer opp ekstremt positiv. Greit, så du vet det, så vi har noen glade ord her: takk, utropstegn og så videre. Det kan bidra til høy poengsum. Ok, så er det perfekt? Nei, men det vil gi deg en rask, rask måte å fortelle deg, du vet, hvor mange mennesker som er ekstremt glade eller ekstremt negative med disse svarene.
Og selvfølgelig, her, her kan vi gjøre dette med en pivottabell: Sett inn, pivottabell, gå til et eksisterende regneark her, klikk OK, og vi er interessert i følelsen, og kanskje med den gjennomsnittlige poengsummen er for hver av dem. Så vi endrer dette under Feltinnstillinger for å være et gjennomsnitt, klikk OK. Og så, eller kanskje til og med en greve. Jeg antar at vi vil vite greven, hvor mange mennesker. Så vi tar et annet felt, og så vet vi hvor mange mennesker som var negative. Ooh, hvor mange mennesker var nøytrale, hvor mange mennesker var positive og hva gjennomsnittlig poengsum for hver av dem var.
OK, så hvis du har undersøkelsesdata og det er flervalg, er det enkelt å bruke en pivottabell for å finne ut hvor mange prosent hvert svar har. Men for tekstformulære svar er det vanskelig å behandle. Hvis du har hundrevis eller tusenvis av dem, er sentimentanalyse en maskinbasert metode for å forutsi om svaret er positivt eller negativt. Microsoft tilbyr et gratis verktøy for dette. Fungerer i Excel 2013 eller Excel 2016, kalt Azure Machine Learning. Må vanligvis gå gjennom og kategorisere 5% av uttalelsene manuelt for hånd. Det er ikke fleksibelt, du må kategorisere for hvert nye datasett, men Excel bruker dette MPQA-subjektivitetsleksikonet. Det er en generisk ordbok. Det kommer til å fungere for korte setninger, tweets, Facebook-innlegg. Jeg kan la meg lure av dobbeltnegativer. Så bare gå til Excel Store,søk etter Azure Machine Learning. Spesifiser en inngang og to kolonner for et utgangsområde. Ikke glem å endre overskriften for å matche skjemaet, tweet_text, i dette spesielle tilfellet.
Ok, så der går du. Neste gang du har en stor mengde data å analysere, sjekk ut ved hjelp av Azure Machine Learning, det gratis tillegget for Excel 2013. Takk for at du var innom, vi sees neste gang for en ny netcast fra.
Last ned fil
Last ned eksempelfilen her: Podcast2062.xlsm