Din când în când, spațiul public se inflamează pe tema autonomiei Ținutului Secuiesc. Inflamările astea apar random? În funcție de ce? Extistă un pattern? Pot fi prevăzute?

Analiștii sunt în general de acord că astfel de infamări apar în preajma (în timpul) diverselor campanii electorale. Nu știu dacă au dreptate sau nu, pentru că niciunul nu a produs dovezi în sprijinul acestei teorii. Voci mai timide susțin că inflamările apar în momentele de slăbiciune (incertitudine) ale politicii externe a României. Sau interne. Nici asta nu știu dacă e adevărat sau nu, pentru că nu am văzut nicio dovadă.

O să încerc să improvizez o metodă care să mă ajute să obțin dovezi. Dacă o să fie utilă sau inutilă, iarăși nu știu. La fel de neclar îmi este și dacă o să funcționeze sau o să fie o pierdere de timp și energie.

La fel de adevărat este că nici n-o să aflu vreodată, dacă nu încerc. Am încercat eu multe alte prostii, așa că nu văd de ce nu mi-aș pierde timpul și cu asta.

Așadar, s-o luăm logic:

Cum pot fi definite inflamările astea publice pe tema autonomiei Ținutului Secuiesc? Cum pot fi măsurate? Categorisite, clasificate etc…

Mă gândesc că una dintre modalitățile “basic” de abordare ar fi legată de numărul de articole media dedicate subiectului, pe o logică simplă, a unei funcții liniare: cu cât numărul de articole publicate cu tag-ul ”autonomia ținutului secuiesc” este mai mare, cu atât putem vorbi de o ”inflamare” mai accentuată a subiectului. Îmi pare o abordare suficient de cinstită și corectă.

Bun!

Însă despre ce medii de informare vorbim?

Aici e o discuție întreagă, pe care am s-o evit sărind direct la concluzie: cred că cel mai obiectiv lucru ar fi să ne limităm la agențiile de presă și, dacă și doar dacă va fi cazul, la una sau două platforme online din vârful piramidei de trafic.

Mediafax, Agerpres, news.ro – cam astea ar fi, la care (vedem dacă o să fie cazul) mai adăugăm probabil și adevărul.ro. Am să ignor cu desăvârșire ziare.com și hotnews.ro care nu fac presă ci îndeplinesc ordine, ceea ce poate afecta din start eventualele rezultate.

Ca să aibă sens datele obținute, ele vor trebui să fie într-o formă ușor de prelucrat în orice posibilă utilizare viitoare, așa că mă gândesc să le structurez astfel:

1. Data

2. Numărul de știri

3. Titlul (pentru o eventuală analiză a caracterului știrii: neutră/pozitivă/negativă

Hai să fie și excel , că este cel mai ușor de utilizat.

N-am acces (legal) la bazele lor de date (ce frumos ar fi fost!), așa că trebuie să le obțin pe calea cea lungă.

Sa zicem Mediafax:

Rezultatul brut poate fi vazut in tableful de mai jos.

Știu că arată ciudat, însă stringurile se vor dovedi folositoare mai târziu, la NPL (Natural Language Processing): Cel puțin așa sper!

Până atunci, procedăm cam la fel și cu Agerpres, apoi luăm din tabele ce ne interesează în acest moment: numărul de știri apărute de-a lungul timpului, mai exact de azi înapoi până în ianuarie 2012. Și obținem un alt tabel, aka ăsta de mai jos:

Bun, e timpul să vedem ceva mai concret cu ochii noștri, așa că încercăm să vizualizăm un grafic simplu: evoluția numărului de știri în timp:

Găsiți mai jos graficele și în format pdf:

Grafice

Graficele rezultante îmi spun că nu m-am înșelat chiar așa tare: ambele agenții de presă au cam același ritm – momentele de inflamare se văd cu ochiul liber. Agerpres pare chiar mai vigilent ca Mediafax, sau Mediafax mai echilibrat ca Agerpres… însă analiza asta o s-o facem cu altă ocazie, când vom șurubări textele știrilor.

Oricum, se văd de la o poștă momentele de inflamare. Pe care le luăm la puricat next time!

 

http://musetoiu.ro/wp-content/uploads/2017/10/Tinutul-secuiesc-pe-Google-Maps-1024x576.pnghttp://musetoiu.ro/wp-content/uploads/2017/10/Tinutul-secuiesc-pe-Google-Maps-150x150.pngdan musetoiuDe necategorisitOnlinepython,tinutul secuiesc
Din când în când, spațiul public se inflamează pe tema autonomiei Ținutului Secuiesc. Inflamările astea apar random? În funcție de ce? Extistă un pattern? Pot fi prevăzute? Analiștii sunt în general de acord că astfel de infamări apar în preajma (în timpul) diverselor campanii electorale. Nu știu dacă au dreptate...