Rakenteettoman tiedon hallinta – Dark Data?

Rakenteettoman tiedon hallinta – Dark Data?

Unstructured data – ne kaikki tuhannet excelit ja muut dokumentit, jotka ovat jossain. Ne tuhannet sähköpostien varmuuskopiot ja muut tiedostot, joita silloin tällöin tarvitaan. Tai tarvitaanko?

EU GDPR:n osalta olisi syytä luokitella tietoa: mitä tarvitaan, mikä sisältää henkilötietoa, mikä on turhaa, kuka omistaa tiedon. Ongelma on siinä, että käyttäjät ovat vuosikausia luoneet dokumentteja, tallentaneet, muuttaneet ja kopioineet eri paikkoihin. Laitteet ovat vaihtuneet ja kopioita on luotu varalta lisää. Käyttäjät ovat vaihtuneet, siirtyneet, poistuneet. Miljoonia tai kymmeniä miljoonia tiedostoja. Osa on itsellä, osa voi olla pilvessä, osa siellä täällä.

Tarvitsetko niitä kaikkia. Et. Ei kukaan tarvitse niitä vanhoja tiedostoja, joissa on vanhoja nimilistoja tai henkilöhakemuksia. Ja joita kukaan ei ole tarvinnut vuosikausiin. Uskallatko poistaa niitä – ja millä perusteella?

Kokemuksemme mukaan organisaatioissa on teratavuittain tietoa. Tämä tarkoittaa miljoonia tiedostoja, joita tallennetaan ja suojataan joka päivä. Pääosin turhaan. Joidenkin arvioiden mukaan yli 60% käyttäjistä pääsee sellaiseen tietoon käsiksi, johon ei pitäisi. Osa näistä käyttäjistä omaa liika käyttöoikeuksia ja lisäksi ei ole vaihtanut salasanaa vuoteen. Tai koskaan. Pääosin turhia tietosuojaloukkausriskejä.

 

Tietosuojan osalta olisi järkevää kartoittaa mitä tietoa on, kuka pääsee niihin ja onko tiedoissa EU GDPR:ään liittyvää henkilötietoa. Yleensä ottaen noin 5-10 prosenttia tiedostoista sisältää sellaista tietoa, josta pitäisi olla huolissaan. Helppo juttu. Pyydät käyttäjiä käymään tiedostot läpi ja merkitsemään mikä on mitäkin tietoa. Samalla on hyvä tarkistaa, onko käyttäjää edes olemassa enää – milloin se Pertti lähtikään ja onko Erkin tiedot enää tarpeellisia?

Tai me voimme tehdä sen automaattisesti. Sisältö luokitellaan ja luodaan raportit. Olemme vähän tehokkaampia, sellainen keskimäärin muutama sata tiedostoa minuutissa, mutta tarvittaessa huomattavasti nopeamminkin. Aika nopea kaveri pitää olla, jotta pysyy meidän vauhdissa. Kysy lisää ja tilaa Dark Data Assessment, näitä on tehty vuodesta 2016. Metsäyhtiöstä ja teleoperaattorista putkiyhtiöön. 

Lisätietoja tästä tai tilaa tästä.

#DDA #Dark Data Assessment #GDPR #Rakenteettoman tiedon kartoitus

Oikein- ja väärinkäsityksiä re: GDPR

Oikein- ja väärinkäsityksiä re: GDPR

”Tieto on tämän ajan uusi öljy.” Kun tiedetään mitä kaikkea öljyyn on aikojen saatossa liittynyt (mm. sotia, taloudellista kukoistusta sekä ympäristökatastrofeja), on paikallaan että sääntelyä kehitetään mieluummin etupainotteisesti. Sääntelyn toteuttaminen ja valvominen saattaa toki olla hankalaa, väärinkäsityksiä aiheuttavaa ja jopa turhauttavaa. 

GDPR ei kuitenkaan sisällä mitään sellaista mihin ei olisi joka tapauksessa syytä ottaa yrityksessä kantaa ja minkä suhteen on hyvä työstää ja selkiyttää yrityksen käytäntöjä. Sääntelyn muututtua (/ muuttuessa re: kansallinen tietosuojalaki vielä vaiheessa) osaksi pakottavaa lainsäädäntöä asiat toki saattavat muuttua eri aikataululla ja eri järjestyksessä tärkeysjärjestyksen mukaan. 

Kysymys ei ole suurempaa mystiikkaa sisältävistä toimista. GDPR on henkilötietojen käsittelyn perälauta joka jättää organisaatiolle harkintavallan vaatimusten toteutustavoista. On myös huomioitava että GDPR:n lisäksi on olemassa muutakin henkilötietoihin liittyvää lainsäädäntöä. 

Omaa oikein- ja väärinkäsitysteni sekä oppimiskäyräni tasoa määrittelee – kaiken muun lisäksi – tällä hetkellä Sarasen Data Security Pro -ohjelman koulutuspäivät. 

Viime viikolla opin mm. että web-sovellusten tietoturvassa top10 -uhat eivät ole merkittävästi muuttuneet vuodesta 2013 vuoteen 2017. (Kouluttaja: ”Eikö mitään ole opittu?”) Lisäksi web-sovelluskehityksessä käytetään paljon ulkopuolisia hyvin erilaisista yhteyksissä haalittuja kirjastoja joissa saattaa olla tietosuojaan liittyviä ”ylläreitä”. Joissain tilanteissa testauksessa saatetaan edelleen käyttää juridisiin henkilöihin liittyvää materiaalia. (Realistisen testin ajamiseksi ei olisi pakko: http://www.iri.com/solutions/test-data).

Työ jatkuu ja sitä on paljon. Oma toivomus on että GDPR:aan liittyviä shokkiotsikoita sekä vastakkainasettelua olisi mahdollisimman vähän ja näiden sijaan keskityttäisiin pitkäjänteiseen perustyöhön sekä realistisiin ja käytännönläheisiin toteutuksiin mitä GDPR-yhteensopivuuden toteuttaminen ja ylläpito oikeasti on. Ja loppujen lopuksihan GDPR:ssa kyse on ihmis- eli meidän kaikkien oikeuksista kuten Human Rights Watch uutisoi

Pysytään linjoilla ja kyllä tämä tästä.

Teksti: Mervi Hongisto