Elsa Tanás #5241
Lyrics
Gente, acabo de encontrar un LOST MEDIA de la música.
El problema está en que tiene letra en cuatro idiomas.
Es decir. Las que están cantando lo hacen con líneas en inglés, coreano, japonés y chino. ¿Alguna iA que detecte palabras, letras o en que lugar puedo consultar con gente que hable estos idiomas? Porque hablarlos lleva AÑOS de estudio.
Eder Ernesto Soto Nolasco #5250
Haber el audio en cuestión conozco a un chino,a un hondureño y a un japonés son mis mascotas personales y si les pregunto me responden en fa
Anónimo #5264
Whisper de OpenAI es muy bueno reconociendo texto sin música. A lo mejor podrías intentar quitarle la parte instrumental y procesar el audio por ahí. Ojo que capaz se confunde si hay fragmentos con distintos idiomas, capaz te sirve crear archivos de audio con cada idioma por separado y usar eso con Whisper
Anónimo #5265
>>5241Ni puta idea sobre eso, pero esa pic de Makima me dio una muy buena idea. Ya vuelvo.
Anónimo #5268
>>5264es cierto lo que dice este wei, yo lo uso para un programa que tengo que descarga videos largos y genera capitulos, hay partes en inglés y otras en español y detecta ambas
yo uso este fork de whisper, es super facil de utilizar, solo necesitas unas cuantas lineas y ya depende del poder de tu PC si usas un modelo pesado o uno ligero
https://github.com/SYSTRAN/faster-whisper?tab=readme-ov-file#usage