Betyg
95 %
Användarbetyg
Betygssätt videon
Beskrivning:
Känner du som jag att ibland är livet inte så glamoröst som du önskade? Fast på hemmakontoret i mysbyxor? Med detta lilla script så tas en bild var 5:e sekund från din webbkamera och skickas till GPT4-V (vision) som analyserar bilden och promptas att agera som David och låta honom vara berättarrösten som om du vore i en av hans dokumentärfilmer. Detta skickas sedan till Elevenlabs för text to speech där hans klonade röst kommer tillbaka till din dator. Det är svårt att hålla masken. 🙂 Men också fantastiskt att se hur dessa modeller faktiskt kan läsa av bild nuförtiden.
Nästa steg kanske blir Morgan Freeman som ger mig livstips i realtid.
Här finns kod https://github.com/cbh123/narrator