/t/ Tecnología

Volver Abajo

Estás respondiendo un hilo
Nombre
Opciones
Mensaje
Archivo

Imagen: Makima_Anime_2.png 53.23 KB 300x1019

Elsa Tanás #5241

Lyrics
Gente, acabo de encontrar un LOST MEDIA de la música.
El problema está en que tiene letra en cuatro idiomas.
Es decir. Las que están cantando lo hacen con líneas en inglés, coreano, japonés y chino. ¿Alguna iA que detecte palabras, letras o en que lugar puedo consultar con gente que hable estos idiomas? Porque hablarlos lleva AÑOS de estudio.

#5250

Haber el audio en cuestión conozco a un chino,a un hondureño y a un japonés son mis mascotas personales y si les pregunto me responden en fa

Anónimo #5264

Whisper de OpenAI es muy bueno reconociendo texto sin música. A lo mejor podrías intentar quitarle la parte instrumental y procesar el audio por ahí. Ojo que capaz se confunde si hay fragmentos con distintos idiomas, capaz te sirve crear archivos de audio con cada idioma por separado y usar eso con Whisper

Anónimo #5265

>>5241
Ni puta idea sobre eso, pero esa pic de Makima me dio una muy buena idea. Ya vuelvo.

Anónimo #5268

>>5264
es cierto lo que dice este wei, yo lo uso para un programa que tengo que descarga videos largos y genera capitulos, hay partes en inglés y otras en español y detecta ambas
yo uso este fork de whisper, es super facil de utilizar, solo necesitas unas cuantas lineas y ya depende del poder de tu PC si usas un modelo pesado o uno ligero
https://github.com/SYSTRAN/faster-whisper?tab=readme-ov-file#usage



Volver Arriba Responder Actualizar
allbaawdwintsadttoyvx34efh