Betyg

95 %

Användarbetyg

1 användare har betygssatt
Betygssätt videon

Beskrivning:

Känner du som jag att ibland är livet inte så glamoröst som du önskade? Fast på hemmakontoret i mysbyxor? Med detta lilla script så tas en bild var 5:e sekund från din webbkamera och skickas till GPT4-V (vision) som analyserar bilden och promptas att agera som David och låta honom vara berättarrösten som om du vore i en av hans dokumentärfilmer. Detta skickas sedan till Elevenlabs för text to speech där hans klonade röst kommer tillbaka till din dator. Det är svårt att hålla masken. 🙂 Men också fantastiskt att se hur dessa modeller faktiskt kan läsa av bild nuförtiden.
Nästa steg kanske blir Morgan Freeman som ger mig livstips i realtid.
Här finns kod https://github.com/cbh123/narrator

Lämna en kommentar

Din e-postadress kommer inte publiceras. Obligatoriska fält är märkta *