Google dos sons
Encontrar rapidamente palavras dentro de textos e documentos é a grande solução por trás do sucesso das maiores empresas da internet desde o seu começo.
Mas tente procurar um som - um cantarolar, as notas de uma música ou o trecho de um discurso - e você se descobrirá rapidamente de volta ao mundo das enciclopédias de papel e das fitas de rolo.
Mas um novo sistema de inteligência artificial promete o que até agora nem mesmo o Google conseguiu: entender e indexar sons.
Hoje, as músicas e outros sons só podem ser encontrados por meio das descrições de texto que alguém colocar manualmente junto com os arquivos.
Mas o novo programa consegue ler o próprio arquivo, identificando o trecho procurado.
"Ele funciona como um engenheiro de estúdio virtual, selecionando as trilhas com as características que melhor atendam às características que o usuário definiu como ideais," disse Jay LeBoeuf, um dos criadores do MediaMined.
Indexação de sons
O programa acabou de ser testado em um dos maiores estúdios de som de Hollywood. E os resultados deixaram todos entusiasmados.
"Digamos que você esteja trabalhando em um filme e o diretor precise de algumas explosões. Se procurar por 'explosão' no nome do arquivo, você vai deixar de lado 'estouro', 'detonação', 'bomba' etc.," compara LeBoeuf.
Já o programa agrupa todos esses sons pelas suas características, seja a explosão de uma bomba atômica ou o estouro de um traque.
O programa usa três camadas de análise para processar os arquivos de áudio.
Primeiro ele detecta as propriedades das ondas de som gravadas no arquivo - valores de amplitude e frequências, por exemplo.
No segundo estágio de processamento o programa aplica técnicas estatísticas para comparar as características do som com as características de sons similares já analisados e guardados em uma base de dados - o ritmo, a temporização, os picos de volume etc.
Isso significa que o programa fica mais eficiente conforme sua base de dados cresce - na fase beta, ele conta com cerca de 10 milhões de arquivos, somando ao redor de 10 terabytes de dados.
Finalmente, as ferramentas de aprendizado de máquina entram em ação para categorizar o arquivo de som e apresentar o resultado ao usuário.
Buscas nas nuvens
Buscas típicas feitas pelo MediaMined podem incluir, por exemplo, arquivos com voz masculina, aplausos, som de tambores, música rock etc.
Mas não espere por um "Google dos sons" tão já, pelo menos não da forma como funciona o "Google das palavras".
Ocorre que, para analisar cada arquivo de som, esse arquivo deve ser enviado para um servidor, onde é feita a análise e fornecida a resposta.
Outro tipo de uso, pela internet, como seria mais prático, levanta a questão da segurança, uma vez que o aplicativo teria que ler arquivos no computador do usuário.
Mas o pesquisador afirma que o programa pode ser uma solução para a computação em nuvem, uma vez que os arquivos já estarão armazenados remotamente.
Nenhum comentário:
Postar um comentário