Onko dokumenttienhallintasi kaatopaikka vai hautausmaa?

10.5.2021 12:20 / by Jaakko Riihinen, Principal Consultant    |    4 min read

Olen viime vuosina saanut läheltä seurata muutamia dokumenttien- ja sisällönhallinnan tietojärjestelmähankkeita. Digitalisaation myötä myös strukturoimaton tieto erilaisten esitettävien sisältöjen ja dokumenttien muodossa lisääntyy valtavaa vauhtia. Kutsuttakoon näitä yhteisesti tässä tiedostoiksi. Tiedostojen määrä voi pienessäkin organisaatiossa olla kymmeniä tai satoja tuhansia, isommissa miljoonia tai kymmeniä miljoonia. Vaikka osa tiedostojen sisältämästä tiedosta ui ajan mittaan strukturoituihin tietokantoihin, organisaatioissa tulee aina olemaan merkittävä määrä tiedostoja.

Dokumenttikaaos ei ole enää näkyvillä, vaan bittiavaruudessa

Lähes jokaisen organisaation johto on tämän kehityksen huomannut ja ryhtynyt jonkinlaisiin toimenpiteisiin, joko varautuakseen asiaan etukäteen tai ehkä tavallisimmin jouduttuansa keskelle hallitsematonta kaaosta. Jos tiedostot olisivat paperilla, voisimme nähdä toimistohuoneita ja suuria varastoja, joissa olisi jokunen dokumenttikaappi ja lukematon määrä sikin sokin olevia nimettömiä paperipinoja, osa kaapeissa, osa niiden päällä, osa tuolien päällä ja monet lattialla tai sinne kaatuneina, oman onnensa varaan jätettynä, rypistyneinä ja kahvin tahraamina. Kaiken tämän seassa harhailisi turhautuneita työntekijöitä etsimässä paikkaa, johon voisi kipata seuraavan kuormansa tai josta mahdollisesti voisi löytää etsimänsä dokumentin. Tämä näky saisi kenet tahansa ymmärtämään, että jotain on pahasti pielessä, mutta kun sotku sijaitsee bittiavaruudessa, ongelman tajuaminen pitkittyy, kunnes se räjähtää silmille.

Tiedostot ovat perinteisesti sijainneet käyttäjien työasemissa ja jaetuilla verkkolevyillä, mikä ratkaisuna on yksinkertainen, mutta sisältää ongelmia:

  • Työasemissa olevat tiedostot ovat toisille käyttäjille näkymättömissä. Lean & agile -toimintamallin perusteisiin kuuluu, että tieto varustetaan metatiedolla, jonka avulla sen tila on tiedossa ja sitä voidaan hyödyntää myös keskeneräisenä.
  • Eri henkilöt tekevät toisistaan tietämättä samasta aiheesta useita sisällöltään päällekkäisiä ja/tai ristiriitaisia tiedostoja.
  • Eri henkilöt tekevät samasta tiedostosta useita muunnelmia, jotka päätyvät hallitsemattomasti eri paikkoihin.
  • Tiedoston elinkaaren hallintaan ei ole työnkulkuja ja tilamalleja tukevia toimintoja.
  • Työasemisssa oleva tieto ei ole automaattisen varmuuskopioinnin piirissä ja voi hukkaamisen tai laiterikon johdosta hävitä, vaikka massamuistin salauksen avulla sisältö olisikin suojassa.
  • Verkkolevy ei sellaisenaan mahdollista reaaliaikaista yhteiskäyttöä eikä versionhallintaa.
  • Käyttöjärjestelmätason käyttövaltuuksien ja pääsynhallinnan soveltaminen verkkolevyn tiedostojärjestelmän kansioihin ja tiedostoihin on liian vaikeaa, jotta sitä voisivat käyttää muut kuin kokeneet pääkäyttäjät. Se ei skaalaudu hajautettuun pääsynhallintaan, jossa tavallinen käyttäjä haluaa kutsua kollegoitaan yhteistyöhön jaettuun työtilaan tai jaetun dokumentin kimppuun.
  • Tiedostoja voi organisoida ainoastaan yhdessä ulottuvuudessa eli yhden hierarkisen kansiorakenteen mukaan.

Mikä sitten avuksi dokumenttien hallintaan?

Muun muassa näiden ongelmien ratkaisuksi on kehitetty dokumenttien hallinnan ja sisällönhallinnan sovelluksia. Ne ratkaisevat yleensä yhden tai useamman edellä mainituista ongelmista. Esimerkiksi suomalainen M-Files ratkaisee tiedon moniulotteisuuden ongelman yksinkertaisesti tarjoamalla vapaasti valittavan määrän käyttäjän määrittelemiä kansiorakenteita, jolloin sama tiedosto voi sijaita yhtaikaa useassa kansiossa. Sharepoint tarjoaa versiohistorian ylläpidon ja Teams hajautetun käyttövaltuuksien hallinnan, jolloin ei tarvitse olla pääkäyttäjä tai muu guru kutsuakseen osallistujia työtilaan.

Pari ongelmaa jää kuitenkin vaille ratkaisua kaikissa dokumenttien ja sisällönhallinnan järjestelmissä: ne eivät kerro sinulle, minkälainen talletusrakenne ja metatietomalli olisi optimaalinen koko organisaatiosi kannalta, eivätkä ne suorita säännöllistä metatietojen laadunvalvontaa tai rakenteiden viikkosiivousta ja kevätsiivousta. Nämä jäävät organisaation omien ihmisten tehtäväksi, eikä se ole kovin helppo asia hyväksyä - se kun on raakaa työtä.

Hyvin tyypillistä on, että käyttäjillä on oikeudet perustaa kansioita ja työtiloja melko vapaasti, ja näistä rakenteista muodostuu sotkuisia härveleitä. Jos organisaatiossa onkin mietitty metatietojen kirjaamista tiedostoihin, niitä määritellessä on mopo karannut käsistä ja tuloksena on raskas malli. Eräässä organisaatiossa oli päädytty kolmeen manuaalisesti kirjattavaan metatietoattribuuttiin per dokumentti - mikä vielä juuri ja juuri voisi onnistua - mutta kyseisten attribuuttien alasvetovalikoissa oli yhteensä parisataa arvoa, joista piti valita. Juuri kukaan ei niitä sitten käyttänyt.

Tietysti voidaan kysyä, miksi ylipäätänsä käyttäjien pitäisi huolehtia talletusrakenteista. Onhan sentään hakumoottorit keksitty. Laitetaan tiedostot jonnekin satunnaiseen paikkaan ja googlataan ne esiin tarpeen mukaan. Tässä on yksi sangen huono puoli: se toimii, jos tiedät melko tarkkaan, mitä tiedostoa olet hakemassa. Jos sen sijaan haluat muodostaa kuvan, mitä aihealueita ja niihin kuuluvia tiedostoja on olemassa, hakumoottori ei ole siihen hyvä työkalu. Palataan siihen, että talletusrakenteet ovat myös hakurakenteita, tai oikeammin, selailurakenteita.

Optimaalinen talletusrakenne - totta vai tarua?

Miten sitten suunnitellaan optimaalinen talletusrakenne? Eräs hyvä lähestymistapa on semanttinen indeksointi. Periaatteessa on kysymys informaatioarkkitehtuurin yhdestä osa-alueesta, jossa pyritään tunnistamaan organisaation kannalta tärkeimmät tietoryhmät, kuten erilaiset toimijat (oman organisaation yksiköt ja funktiot, asiakkaat, kumppanit, toimittajat), tuotteet ja prosessit. Näistä muodostetaan ylimmän tason kansiot, ja alemmilla tasoilla pyritään pysymään ylemmän tason semantiikassa ja jäsentämään sitä tarkemmin. Esimerkiksi yleiset yritystason markkinointimateriaalit pidetään markkinoinnin kansioissa ja tuotteen ominaisuuksista kertova materiaali tuotteen kansiossa. Kansiorakenteen lisäksi määritellään myös tiedostojen nimeämissäännöt, jotta on mahdollisimman helppoa selata kansioita ja päätellä tiedostojen sisältö niitä kuitenkaan avaamatta.

Tiedonhoitaja pitää tietohuushollin siistinä

Tarkoitukseen on kehitetty tekoälyn avulla toimivia semanttisen luokittelun apuvälineitä, mutta semanttinen indeksointi voidaan toteuttaa jopa manuaalisesti aivan tavallisen tiedostojärjestelmän varaan. Silloin tosin jäävät monet alussa kuvatut dokumenttien hallinnan tekniset ongelmat ratkaisematta. On myös muistettava, että työ vaatii tekijänsä ja selkeän vastuutuksen. Tietoarkkitehtuurissa onkin alkanut vakiintua käsite tiedonhoitaja (data steward), jonka tehtävänä on pitää tietohuusholli siistinä ja mukauttaa sitä kehittyviin tarpeisiin. Tämä rooli vaatii erityistä osaamista ja pitää tunnistaa myös strukturoimattoman tiedon osalta. Se kannattaa, sillä hyvän järjestyksenpidon kautta koko organisaation kallista aikaa rupeaa säästymään ja voidaan keskittyä tuottavampiin asioihin kuin hukassa olevan tiedon etsimiseen tai sen tahattomaan duplikointiin.

Jos sitten organisaatiossa lähdetään hankkimaan uutta dokumenttien hallintajärjestelmää, on pidettävä mielessä paitsi tuo tiedonhoitajan rooli, myös se seikka, että vanhan ja uuden järjestelmän rinnakkainelo saattaa kestää kauan ja mahdollinen sisällön siirtäminen sisältää hyvinkin kinkkisiä ongelmia.

Sellaiseen hankkeeseen ei pidä lainkaan lähteä, jos tuloksena on vain uudella teknologialla toteutettu tiedon kaatopaikka tai hautausmaa.

 

 

Haluatko kuulla lisää?

Varaan tapaamisen

 

 

 

Topics: Enterprise Architecture, Data Management, Kokonaisarkkitehtuuri, QPR EnterpriseArchitect, laadunhallinta, Prosessien kehittäminen, Tiedonhallinta, Tietoarkkitehtuuri

Jaakko Riihinen, Principal Consultant
Written by Jaakko Riihinen, Principal Consultant

Jaakolla on ainutlaatuisen laaja ja pitkä kokemus pienten ja suurten organisaatioiden vastuullisista johtamis- ja kehittämistehtävistä. Kokonaisarkkitehtuurin parissa hän on työskennellyt yli 30 v. sekä strategialähtöisesti, että tietojärjestelmähankkeiden yhteydessä. Jaakko on näiden päätehtäviensä ohella jakanut osaamistaan ja kokemustaan kouluttamalla alan ammattilaisia yksityisissä yrityksissä ja yliopistoissa Suomessa ja ulkomailla. Jaakko Riihinen tunnetaan yritysarkkitehtuurin eli kokonaisarkkitehtuurin pioneerina Suomessa ja hän on toiminut myös kokonaisarkkitehtuurin osaamisyhteisön (KAOS) isännistön puheenjohtajana.