AI-röster är temat när Stockholms universitet firar Världsröstdagen

Den 23 april arrangerar Stockholms universitet en helkväll till röstens ära, med temat AI och röst. Genom dagens AI-teknologi skapas helt nya möjligheter att utforska vad den mänskliga rösten faktiskt är – dess enorma kapacitet och betydelse. Firandet är en del av den årliga Världsröstdagen, World Voice Day.

Illustration: ChatGPT: AI och Röst
AI och röst är temat för Världsröstdagen 2025 på Stockholms universitet. Illustration: ChatGPT

– Rösten är ju en av våra främsta resurser för kommunikation, säger Gláucia Laís Salomão, tal- och röstforskare vid Institutionen för lingvistik, Stockholms universitet. Redan när vi föds blir rösten en central del av vår sociala identitet. Vi använder rösten varje dag, men lägger ofta inte märke till den förrän någon typ av röststörning uppstår. Därför vill vi att fler ska bli medvetna om röstens stora betydelse i livet genom Världsröstdagen. 

Artificiella röster utvecklas i allt snabbare takt, och blir allt ’mänskligare’

Men idag är det inte bara människor som pratar. Numera hörs artificiella röster överallt i vardagen. De finns i datorer, mobiler, högtalare, hörlurar. De utvecklas i allt snabbare takt, och blir allt ”mänskligare”. AI relaterad till röst öppnar för en rad möjligheter:

Gláucia Laís Salomão, tal- och röstforskare, Stockholms universitet.
Gláucia Laís Salomão, Foto: Privat

– AI-baserade tekniker kan bland annat bidra till tidig upptäckt av subtila röstförändringar, som kan tyda på röststörningar – eller till och med psykiska eller neurologiska sjukdomar, säger Gláucia Laís Salomão. AI kan också hjälpa till med att följa återhämtningen av rösten under behandling, och ge återkoppling under röstterapi. Det gynnar både läkare och patienter.

Om man helt har förlorat sin röst – till exempel på grund av ett kirurgiskt ingrepp – kan AI dessutom återskapa en personlig, syntetisk röst. Och konstnärer använder AI-röster för att ge liv åt kreativa idéer.

Forskningen om AI och röster ur en mängd perspektiv

Under evenemanget på Stockholms universitet kommer flera röstforskare och experter att berätta om förhållandet mellan AI och röster utifrån en mängd perspektiv. Något som forskningen om AI och röster verkligen har gjort oss uppmärksamma på är själva definitionen av den mänskliga rösten. Vad omfattar den egentligen?

– Få människor tänker på är att rösten är en del av kroppen, säger Gláucia Laís Salomão. I kombination med vårt ansikte – och hela vår kropp – avspeglar rösten vilka vi är, vad vi vill och hur vi känner oss. Datorer saknar däremot kropp, känslor och medvetenhet. AI-genererade röster bygger enbart på statistiska inlärningar av mönster ofta utifrån oorganiserad input. 

Interaktioner mellan människor är extremt dynamiska och kontextberoende

Den mänskliga rösten innehåller så många subtila drag. Dessa kan beskrivas inom fonetiken, men är ofta svåra för en dator att återge – särskilt med korrekt och precis anpassning till det pågående sammanhanget.

Interaktioner mellan människor är extremt dynamiska och kontextberoende. De påverkas ständigt av situation, relation och subtila signaler i kommunikationen. Det krävs bara en liten avvikelse, en liten skevhet, för att lyssnaren ska förstå att rösten inte tillhör en människa.

– När jag pratar med dig så anpassar jag hela tiden mitt tal till ditt sätt att prata. Jag varierar röststyrka och betoning. Jag avbryter och ger återkoppling. Ur detta perspektiv kan en AI-röst uppfattas som alltför stereotyp, eftersom den ännu inte kan bearbeta viktiga kontextrelaterade indata på ett tillräckligt nyanserat sätt för att anpassa sig till ett naturligt samtal – så som en människa gör, säger Gláucia Laís Salomão.

 

AI-rösterna omfattar fler och fler mänskliga drag

Modern talsyntes är dock på väg att omfatta fler och fler av den mänskliga röstens unika drag, och när AI-röster läser upp ljudböcker och andra texter, kan de redan nu få våra öron att tro att det är en människa som läser. Generativ AI gör det även möjligt att skapa kloner av specifika röster. Kanske börjar AI-rösten redan bli för mänsklig, och det kan uppfattas som skrämmande.

Hur bör dessa AI-röster regleras? Och vad är det egentligen samhället bör sträva efter? Detta är en diskussion som kommer att föras under firandet av Världsröstdagen den 23 april! Varmt välkommen! 

Arrangör av Världsröstdagen på Stockholms universitet är Ideella Föreningen World Voice, tillsammans med Institutionen för lingvistik och med stöd av Rothenberg Foundation och Röstforum Stockholm.

Läs mer om Världsröstdagen (engelska) 

Läs mer om evenemanget på Stockholms universitet

World Voice Day – en dag för att uppmärksamma rösten

Idén med att välja en viss dag för att sprida information om rösten kom ursprungligen från en rad läkare, sångpedagoger, forskare och logopeder i Brasilien 1999. De var bekymrade över att människor lade så lite vikt vid sin röst, och ville höja kunskapen om rösthälsa och förebygga röstproblem. 

Redan tre år senare hade evenemanget spridit sig över världen, och nu firas Word Voice Day internationellt den 16 april varje år. Målet är att uppmuntra alla lära sig mer om rösten samt att stödja röstforskning. 

eventNewsArticle

standard-article

false

{
  "dimensions": [
    {
      "id": "department.categorydimension.subject",
      "name": "Global categories",
      "enumerable": true,
      "entities": [],
      "localizations": {}
    },
    {
      "id": "department.categorydimension.tag.Keywords",
      "name": "Keywords",
      "enumerable": false,
      "entities": [],
      "localizations": {}
    },
    {
      "id": "department.categorydimension.tag.Person",
      "name": "Person",
      "enumerable": false,
      "entities": [],
      "localizations": {}
    },
    {
      "id": "department.categorydimension.tag.Tag",
      "name": "Tag",
      "enumerable": false,
      "entities": [],
      "localizations": {}
    },
    {
      "id": "webb2021.categorydimension.Category",
      "name": "Globala kategorier Nyheter (Webb 2021)",
      "enumerable": true,
      "entities": [
        {
          "id": "webb2021.categorydimension.Category.utbildning_nyheter",
          "name": "Utbildning",
          "entities": [],
          "attributes": [],
          "childrenOmitted": false,
          "localizations": {}
        },
        {
          "id": "webb2021.categorydimension.Category.forskning_nyheter",
          "name": "Forskning",
          "entities": [],
          "attributes": [],
          "childrenOmitted": false,
          "localizations": {}
        }
      ],
      "localizations": {}
    },
    {
      "id": "webb2021.categorydimension.Label",
      "name": "Tema (Webb 2021)",
      "enumerable": true,
      "entities": [
        {
          "id": "webb2021.categorydimension.Label.Språk2",
          "name": "Språk, litteratur och kultur",
          "entities": [],
          "attributes": [],
          "childrenOmitted": false,
          "localizations": {}
        },
        {
          "id": "webb2021.categorydimension.etikett.hjarnan",
          "name": "Hjärnforskning",
          "entities": [],
          "attributes": [],
          "childrenOmitted": false,
          "localizations": {}
        },
        {
          "id": "webb2021.categorydimension.Label.Psyk",
          "name": "Psykologi och mänskligt beteende",
          "entities": [],
          "attributes": [],
          "childrenOmitted": false,
          "localizations": {}
        }
      ],
      "localizations": {}
    },
    {
      "id": "webb2021.categorydimension.Label.en",
      "name": "Themes (Webb 2021)",
      "enumerable": true,
      "entities": [],
      "localizations": {}
    },
    {
      "id": "webb2021.categorydimension.Keyword",
      "name": "Keywords (Webb 2021)",
      "enumerable": false,
      "entities": [],
      "localizations": {}
    },
    {
      "id": "lingvistik.lokala.kat",
      "name": "Lokala kategorier Lingvistik",
      "enumerable": true,
      "entities": [
        {
          "id": "lingvistik.lokala.kat.nyh",
          "name": "Lokala nyheter",
          "entities": [],
          "attributes": [],
          "childrenOmitted": false,
          "localizations": {}
        },
        {
          "id": "lingvistik.lokala.kat.nyh",
          "name": "Lokala nyheter",
          "entities": [
            {
              "id": "lingvistik.lokala.kat.nyh.utb",
              "name": "Utbildning",
              "entities": [],
              "attributes": [],
              "childrenOmitted": false,
              "localizations": {}
            }
          ],
          "attributes": [],
          "childrenOmitted": false,
          "localizations": {}
        },
        {
          "id": "lingvistik.lokala.kat.nyh",
          "name": "Lokala nyheter",
          "entities": [
            {
              "id": "lingvistik.lokala.kat.nyh.fo",
              "name": "Forskning",
              "entities": [],
              "attributes": [],
              "childrenOmitted": false,
              "localizations": {}
            }
          ],
          "attributes": [],
          "childrenOmitted": false,
          "localizations": {}
        }
      ],
      "localizations": {}
    }
  ]
}