Äänitteiden selailtavuus ja kuullun ymmärtäminen on helpompaa, kun voi samaan aikaan seurata tekstimuodossa, mitä äänitteessa parhaillaan sanotaan, mitä sanottiin aiemmin ja mitä on tulossa hetken kuluttua. Tähän liittyen on olemassa WebVTT-standardi (Web Video Text Tracks Format), joka nimestään huolimatta toimii myös audio-tiedostoilla ja jota voi luonnehtia käytettävän tekstin esittämiseksi synkronisoituna muun median kuten äänen tai videon kanssa.

Äänitteen tekstiksi tekeminen on yhdenlaista siirtokirjoitusta, tarkemmin sanottuna transkriptiota (eng. transcribe). Tähän tarkoitukseen on useita erilaisia nettisovelluksia, mutta joista kaikki eivät tunnista suomenkieltä. Niiden hinnoittelussa on paljon eroavuuksia, jotkin tarjoavat jonkin verran ilmaista transkriptiointiaikaa per esim. kuukausi ja ne tuottavat erittäin todennäköisesti toisistaan eroaa laatua.

Eräs vaihtoehto on Googlen Speech-to-Text API, jota voi käyttää suoraan Google Cloud -konsolista. Käytännössä audiotiedosto syötetietona, muutama laatuun vaikuttava valinta ja lyhyehkö hetki odottelua. Tämän jälkeen download-vaihtoehtona on mm. transkription sisältävän SRT-tiedoston lataaminen, joka on tekstitiedostona lähes samanlainen kuin WebVTT-tiedostot (vtt-päätteisiä), mutta jonkalaiseksi transriptio täytyisi konvertoida. Tähän konvertoimiseen tarvitaan erillinen sovellus, joka voi olla Windows-sovellus tai vaihtoehtoisesti voi käyttää lukuisia netistä löytyviä konversio-palveluita, joita löytyy vaikkapa hakusanoilla "convert srt to vtt".

Julkaisusovellukseen käyttäjän ei tarvitse antaa syötetietoina kuin audiotiedoston verkko-osoite ja VTT-tiedoston verkko-osoite. Niiden perusteella luodaan äänisoitin, jonka alla näkyy interaktiivinen transkriptio, jonka tekstikappaleita klikkaamalla kuuntelukohdan sijainti äänitteessä vaihtuu. Äänitteen kuuntelun edetessä transkriptio-tekstistä osoitetaan se kohta, missä kohdin ollaan menossa.

Erityistä huomioitavaa on, että VTT-tiedoston täytyy sijaita sellaisessa paikassa, joka sallii kyseisenlaisten tiedostojen jakelun joko kaikkialle tai julkaisusovelluksen käyttämälle palvelimelle. Suosituksena on, että sijoittaa sekä äänitiedoston, että VTT-tiedoston jo muutoinkin käytettäväksi vaaditun CDN-palvelun tarjoamaan CDN Storageen, sillä sen asetuksista oleelliset Cross-Origin Resource Sharing (CORS) -säädöt löytyvät helposti.

Transkriptio-ominaisuuden esille saaminen vaatii kytkemään kokeelliset toiminnot päälle käyttäjäasetuksista, mutta luodut audio-tyyppiset particularsit säilyvät eheinä varmuuskopioita myöten senkin jälkeen, kun kokeelliset toiminnot on kytketty pois päältä. Tässä tapauksessa kokeellisten toimintojen päälle/pois laittaminen vain näyttää/piilottaa joitain käyttöliittymäelementtejä.