Analiza nastrojów - wskazówki dotyczące programu Excel

Analiza nastrojów w programie Excel! Istnieje bezpłatny dodatek z Microsoft Labs, który umożliwia analizę sentymentów w programie Excel. A co, jeśli musisz przebrnąć przez setki komentarzy do ankiet, aby zobaczyć, co ludzie myślą o Twojej firmie? Excel może przypisać prawdopodobieństwo pokazujące, jak pozytywny lub negatywny jest każdy komentarz.

Obejrzyj wideo

  • Ilościowe określenie danych z ankiety jest łatwe, gdy jest to metoda wielokrotnego wyboru
  • Możesz użyć tabeli przestawnej, aby dowiedzieć się, jaki procent ma każda odpowiedź
  • A co z dowolnymi odpowiedziami tekstowymi? Trudno je przetworzyć, jeśli masz ich setki lub tysiące.
  • Analiza nastrojów jest maszynową metodą przewidywania, czy odpowiedź jest pozytywna czy negatywna.
  • Firma Microsoft oferuje narzędzie do analizy nastrojów w programie Excel - Azure Machine Learning.
  • Tradycyjna analiza sentymentów wymaga od człowieka przeanalizowania i skategoryzowania 5% stwierdzeń.
  • Tradycyjna analiza sentymentów nie jest elastyczna - słownik przebudujesz dla każdej branży.
  • Excel używa leksykonu podmiotowości MPQA (przeczytaj o tym pod adresem http: // bit. Ly / 1SRNevt)
  • Ten słownik ogólny zawiera 5097 negatywnych i 2533 pozytywnych słów
  • Każde słowo ma przypisaną silną lub słabą biegunowość
  • Działa to świetnie w przypadku krótkich zdań, takich jak tweety lub posty na Facebooku
  • Może zostać oszukany przez podwójne negatywy
  • Aby zainstalować, przejdź do Wstaw, Sklep Excel, wyszukaj Azure Machine Learning
  • Określ zakres wejściowy i dwie puste kolumny dla zakresu wyjściowego.
  • Nagłówek zakresu wejściowego musi pasować do schematu: tweet_text
  • Artykuł towarzyszący pod adresem: http://sfmagazine.com/post-entry/may-2016-excel-sentiment-analysis/

Transkrypcja wideo

Naucz się programu Excel z podcastu, odcinek 2062: Analiza nastrojów w programie Excel

Och, hej, to była noc Dziękczynienia i siedzieliśmy przy placku dyniowym, a Jes, nasz przyjaciel, zaczął mówić o przeprowadzaniu analizy nastrojów na Twitterze. Odpowiedziałem: „Hej, wiesz, że Excel potrafi przeprowadzić analizę sentymentów”. I zdałem sobie sprawę, że nie mam dobrego filmu na ten lub inny film na ten temat, więc ten film dotyczy analizy nastrojów w programie Excel.

Teraz pierwsze pytanie brzmi: czym u diabła jest analiza nastrojów? A jeśli przeprowadzisz ankietę wśród swoich klientów i mają oni wybór wielokrotnego wyboru, w którym mogą wybrać od 1 do 5, cóż, jest to naprawdę, bardzo łatwe do przeanalizowania. Możesz po prostu utworzyć małą tabelę przestawną: Wstaw tabelę przestawną, Istniejący arkusz roboczy tutaj, kliknij OK. Chcemy wiedzieć, jakie jest tam pytanie lub odpowiedź na pytanie, a następnie ile odpowiedzi było na każdą z nich, a to daje nam liczbę absolutną. Możesz nawet wejść tutaj i zmienić to w Ustawieniach pola na Pokaż wartości jako% sumy kolumny, w ten sposób.

W porządku, więc dla każdej odpowiedzi możesz sprawdzić, jaki procent osób otrzymuje odpowiedź. W porządku, ale analiza sentymentu dotyczy sytuacji, gdy masz naprawdę długą odpowiedź, w której mówisz: „Hej, dobrze, no wiesz, powiedz nam, dlaczego dałeś nam tę odpowiedź?” A oni, wiesz, używają zdań lub akapitów. Cóż, jeśli masz ich setki lub tysiące, bardzo trudno jest komuś przejrzeć je, przeczytać wszystkie i dowiedzieć się, co się dzieje, dobrze?

Są więc dwa różne rodzaje analizy nastrojów. Zwykle w przeszłości używałeś algorytmu uczenia się nadzorowanego przez człowieka. Więc jeśli masz 5000 odpowiedzi, przejrzyj, wiesz, 200 z nich i wybierz pozytywne i negatywne słowa i wyrażenia. Zasadniczo budujesz słownik pozytywnych i negatywnych słów; ale wiesz, to było bardzo ograniczające. Jeśli zrobiłeś to dla miejsca, które naprawiało samochód, a potem miał innego klienta, wiesz, kto zajmował się czyszczeniem dywanów, te dwa słowniki są zupełnie inne. Musisz w kółko powtarzać uczenie maszynowe lub uczenie się nadzorowane przez człowieka. Tak więc Excel używa czegoś, co nazywa się leksykonem podmiotowości MPQA i możesz przejść do Google. Zawiera informacje na ten temat - 5097 negatywnych słów, 2533 pozytywnych słów. A więc,świetnie sprawdza się w przypadku krótkich zdań, tweetów lub postów na Facebooku. Ale jedno, co zauważyłem, to to, że jeśli ktoś pisze w podwójnych negatywach, nie mogę powiedzieć, że nie nienawidzę tej funkcji, cóż, uczenie maszynowe zawodzi. I do cholery, zawodzę. Nie mogę powiedzieć, czy są szczęśliwi, czy nie.

W porządku, więc oto co robimy. W programie Excel 2013 lub Excel 2016 przejdź do zakładki Wstawianie, przejdź do Sklepu, gdy pojawi się pole wyszukiwania Wyszukaj maszynę Azure, a otrzymasz usługę Azure Machine Learning. Klikamy Dodaj. W porządku, i mamy dwa różne narzędzia: Titanic Survivor Predictor, który jest fajny; oraz dodatek do programu Excel Analiza nastrojów tekstu. Użyjmy tego. W porządku, oto kilka rzeczy, które mogą cię podnieść. Twój nagłówek: Weź akapit, aby wyjaśnić swoją odpowiedź. Musi pasować do schematu, a schemat mówi, że nagłówek musi zawierać tekst tweet_text. A więc tutaj: tweet_text, oczywiście, wielkość liter ma znaczenie. A następnie zamknij schemat, a następnie Przewiduj, Dane wejściowe: od A1 do 100, Moje dane mają nagłówki, Wyjście: DataB1, Uwzględnij nagłówki. Dadzą nam dwie kolumny.Upewnij się, że masz tam 2 puste kolumny; w przeciwnym razie zastąpi dane. Masz 2 możliwości: kilka wierszy na raz lub jako partia. To tylko sto, więc to naprawdę nie ma znaczenia. Wybiorę Predict i BAM! Tylko tak szybko.

W porządku, otrzymujemy 2 kolumny: otrzymujemy sentyment i wynik, w porządku. Przedstawmy więc wyniki jako wartości procentowe z kilkoma miejscami po przecinku. Dobrze, więc 47,496, to sięga od 0 do 100%. Bliskie 100 to skrajnie pozytywne, blisko 0 to skrajnie negatywne, dobrze? Więc tutaj mamy taki, w którym jest drobny problem, doprowadza mnie do szału. Nie mogę znaleźć rozwiązania, więc widzisz, dlaczego jest to oceniane jako skrajnie negatywne. Spójrzmy na jedną, która wypada wyjątkowo pozytywnie. W porządku, więc wiesz, więc mamy tutaj kilka radosnych słów: proszę i dziękuję, wykrzykniki i tak dalej. To może przyczynić się do wysokiego wyniku. W porządku, więc czy to jest idealne? Nie, ale da ci to szybki i szybki sposób, aby powiedzieć ci, wiesz, ile osób jest bardzo zadowolonych lub bardzo negatywnie nastawionych do tych odpowiedzi.

I oczywiście znowu możemy to zrobić za pomocą tabeli przestawnej: Wstaw, Tabela przestawna, przejdź do istniejącego arkusza roboczego tutaj, kliknij OK i interesuje nas Sentyment, a następnie może średni wynik jest dla każdy z nich. Więc zmienimy to w Ustawieniach pola na Średnia, kliknij OK. A więc, a może nawet hrabia. Chyba chcielibyśmy wiedzieć, ile osób liczy Hrabia. Więc zajmiemy się inną dziedziną, więc wiemy, ile osób miało negatywne opinie. Och, ile osób było neutralnych, ile osób było pozytywnych i jaki był średni wynik każdego z nich.

W porządku, więc jeśli masz dane ankietowe i jest to opcja wielokrotnego wyboru, możesz łatwo skorzystać z tabeli przestawnej, aby dowiedzieć się, jaki procent ma każda odpowiedź. Ale w przypadku dowolnych odpowiedzi tekstowych jest to trudne do przetworzenia. Jeśli masz ich setki lub tysiące, analiza nastrojów jest maszynową metodą przewidywania, czy odpowiedź jest pozytywna czy negatywna. Microsoft oferuje do tego darmowe narzędzie. Działa w programie Excel 2013 lub Excel 2016 o nazwie Azure Machine Learning. Zwykle trzeba ręcznie ręcznie kategoryzować 5% stwierdzeń. Nie jest elastyczny, musisz ponownie kategoryzować dla każdego nowego zestawu danych, ale Excel używa tego leksykonu podmiotowości MPQA. To słownik ogólny. Będzie działać w przypadku krótkich zdań, tweetów, postów na Facebooku. Mogę dać się zwieść podwójnemu negatywowi. Po prostu przejdź do sklepu Excel Store,wyszukaj Azure Machine Learning. Określ dane wejściowe i dwie kolumny dla zakresu wyjściowego. W tym konkretnym przypadku nie zapomnij zmienić nagłówka, aby pasował do schematu, tweet_text.

W porządku, więc proszę bardzo. Następnym razem, gdy będziesz mieć dużą ilość danych do przeanalizowania, skorzystaj z usługi Azure Machine Learning, bezpłatnego dodatku do programu Excel 2013. Dziękujemy za zatrzymanie się, do zobaczenia następnym razem z kolejnym netcastem.

Pobieranie pliku

Pobierz przykładowy plik tutaj: Podcast2062.xlsm

Interesujące artykuły...