Big Data Sanomalla

Big datasta, datan prosessoinnista ja analytiikasta

Big datan määritelmä ei ole vakiintunut, mutta useimmiten sillä tarkoitetaan suurta määrää tietoa, joka on järjestäytymätöntä, ja josta jalostetaan tilastollisin ja matemaattisin menetelmin uudenlaista tietoa. Big dataa prosessoidaan erilaisissa tietokannoissa, ja tiedosta muodostetaan algoritmein laskennallisia malleja, joita hyödynnetään muun muassa tuotekehityksessä, liiketoiminnan raportoinnissa sekä myynnin ja markkinoinnin toimenpiteissä.

Sanomalla big data viittaa monenlaiseen tietoon, jota kertyy lukuisista eri lähteistä, muun muassa kuluttajien käyttäytymisestä Sanoman verkkopalveluissa, lehtien tilaajatiedoista, erilaisista paneeli- ja markkinatutkimustuloksista ja mediasisällöistä. Datan avulla pyrimme ymmärtämään asiakkaidemme muuttuneita tarpeita ja luomaan heitä kiinnostavia sisältöjä ja palveluita. Data mahdollistaa lisäarvon tuottamisen niin kuluttaja- kuin media-asiakkaillemme ja se onkin asiakaskeskeisen liiketoimintamme ydin.

Big data ja sen analysointi vaatii erityisosaamista. Sanomalla onkin tätä varten oma analytiikan menetelmiin ja big datan käsittelyyn perehtynyt Data Scientist -tiimi. Se on koulutettu suunnittelemaan datan hyödyntäminen etukäteen, ja huomioimaan datan käytössä lainsäädännön asettamat vaatimukset sekä käytön mahdolliset vaikutukset yksilön tietosuojaan.

Sanomalla uskomme datan ja analytiikan tuomiin mahdollisuuksiin, ja siihen, että viisaasti dataa hyödyntämällä onnistumme luomaan sisällöistä entistä mielenkiintoisempia kokonaisuuksia yksilön tietosuoja huomioiden.

Smart Data — Smart Privacy!

Tunnisteet ja profiilit

Kun data voidaan yhdistää yksilöön, siitä tulee määritelmällisesti henkilötietoa. Isoja datamassoja käsitellään erilaisissa tietokannoissa ja järjestelmissä, liitettynä erilaisiin tunnisteisiin. Henkilötiedossa on siten erilaisia tunnistustasoja, jotka riippuvat siitä, minkälaisten tunnisteiden yhteydessä dataa käsitellään. Alla on esimerkkejä erilaisista tunnistustasoista:

 • Asiakas: Asiakas on tilannut jonkin tuotteemme tai luonut digitaalisen tilin, esimerkiksi Sanoma-tilin. Datan avulla voimme varmistaa, että asiakas saa tilaamansa tuotteen tai pystyy käyttämään digitaalisen tilinsä kautta palvelua, sivustoa tai sovellusta. Asiakkaan asiakastietoja ylläpidetään myös sellaisista henkilöistä, jotka ovat tilanneet sähköpostitse toimitettavan uutiskirjeen.
 • Tunnistettu käyttäjä: Asiakas on tunnistettu käyttäjä, kun hän on jossain vaiheessa kirjautunut käyttämään Sanoman palvelua, sivustoa tai sovellusta digitaalisen tilinsä kautta tai avannut Sanoman asiakkassuhteen perusteella käyttäjälle lähettämän sähköpostiviestin. Tunnistetun käyttäjän tunnisteena toimii tyypillisesti sattumanvaraisesti luotu numerosarja, johon voidaan yhdistää asiakkaan profiilista esimerkiksi asiakkaan antamia demografiatietoja,  tietoa hänen mielenkiinnonkohteista tai tilaushistoriasta. Tallennamme kuitenkin digitaalisen tilin asiakastiedot erillään tunnistun käyttäjän tunnisteesta ja siihen liittyvistä käyttäytymistiedoista.
 • Tunnistetusta käyttäjästä kerättyjä käyttäytymistietoja käytetään mm. palveluiden ja mainonnan räätälöintiin. Ne toimivat myös tuotekehityksessä opetusmalleina, joiden pohjalta kehitetään laskennallisia malleja arvioimaan esimerkiksi demografisia arvoja havainnoidulle käyttäjälle.
 • Havainnoitu käyttäjä: Havainnoitu käyttäjä on palvelun, sivuston tai sovelluksen käyttäjä, jonka erottelemme muista käyttäjistä sattumanvaraisesti luodun numerosarjan perusteella. Koska hän ei ole kirjautunut palveluihimme, emme tiedä käyttäjän nimeä, demografisia tietoja, emmekä esimerkiksi hänen tilaushistoriaansa. Voimme kuitenkin arvioida havainnoidun käyttäjän demografiatietoja käyttäjän palveluissa käyttäytymisen perusteella.
 • Tunnisteita on erilaisia, riippuen siitä, käytetäänkö sivustoa tai palvelua verkon kautta vai sovelluksen kautta mobiililaitteella. Alla esimerkkejä erilaisista tunnisteista:
  • Sanoman selaimelle asettamat evästeet, joilla lasketaan sivustojen kävijämääriä ja käyttöä sekä analysoidaan sivustojen päällekkäiskäyttöä. Näitä evästeitä käytetään tunnistamaan käyttäjä mainonnan tarpeisiin silloin, kun käyttäjä vierailee Sanoman tai sen yhteistyökumppanien verkostoissa
  • Mainostajien selaimelle asettamat evästeet, joita käytetään mainonnan uudelleen kohdentamiseen, kampanjan raportointiin sekä näyttökertojen laskemiseen.
  • Mobiililaitteen sovelluksen yksilöivä tunniste, jota käytetään sovelluksen mainonnan kohdentamiseen ja tutkimukseen. Tuotteen kehittämiseksi varten tunnistetta käytetään myös raportoimaan, miten sovellusta käytetään. Eri sovellusjulkaisijoilla on käytössään eri tunniste. Joten vaikka laite olisikin sama, mainostaja ei voi kohdentaa mainoksia perustuen samalta laitteelta käytettyihin eri sovellusjulkaisijoiden sovelluksiin
 • Evästeiden ja muiden tunnisteiden yhteydessä keräämme tyypillisesti myös seuraavat asiat:
 • Tiedon käytetyn laitteen mallista
 • Kanava, jonka kautta tieto on kerätty, kuten verkkoselain, mobiiliselain tai sovellus
 • IP-osoite, joka toimii Internet-verkkoon kytketyn laitteen julkisena internet-osoitteena. Yleensä kiinteän verkon liittymissä toimiva IP-osoite säilyy samana, mutta matkapuhelinverkon IP-osoite vaihtuu, kun yhteys avataan.
 • Selaimen versio