Skip to content

Como funciona o mecanismo de busca do Google

20 de abril de 2021

Principais vantagens

  • O Google lançou uma nova ferramenta que permite aos usuários pesquisar músicas cantarolando, cantando ou assobiando.
  • A nova ferramenta usa aprendizado de máquina para combinar uma faixa cantarolada com um banco de dados de mais de meio milhão de músicas que é atualizado continuamente.
  • Os usuários do Google perguntam qual música está tocando quase 100 vezes por mês.

laflor / Getty Images

O Google lançou um novo recurso chamado “Hum to Search” para resolver um problema frustrante: ter uma música presa na sua cabeça e não ser capaz de descobrir como ela se chama. A ideia de cantarolar para encontrar uma música parece incrivelmente simples, então por que o Google está lançando esse recurso apenas em 2020? Bem, descobriu-se que identificar as músicas dessa forma é na verdade bem complicado, em parte porque nossas versões cantaroladas tendem a ser bem diferentes da faixa original.

Em um post recente em seu blog de IA, o Google explica como usou o aprendizado de máquina para corrigir esse problema e, por fim, ajudar as pessoas a encontrar uma música cantarolando, assobiando ou cantando a melodia, mesmo quando sua interpretação não é precisa. “Nosso foco no Hum to Search é ajudar as pessoas a identificar e encontrar a música que está presa em suas cabeças”, disse um porta-voz do Google Lifewire em um e-mail.

Basta começar a cantarolar

Os usuários do Google perguntam qual música está tocando quase 100 milhões de vezes por mês, Aparna Chennapragada, vice-presidente do Google e gerente geral de compras ao consumidor, disse um vídeo apresentando vários novos recursos de busca. Agora há uma maneira de descobrir.

O recurso “Hum para pesquisar” está integrado no aplicativo móvel do Google, no widget Pesquisa Google e no Google Assistente. Para acessá-la pelo aplicativo, toque no ícone do microfone e diga “Que música é esta?” Selecionar o botão “Pesquisar uma música” também funciona. Para funcionar corretamente, o recurso exige que você cantarole por pelo menos 10-15 segundos. Os usuários do Android podem cantarolar para encontrar músicas em mais de 20 idiomas, enquanto apenas músicas em inglês funcionam em iPhones. A ferramenta nem sempre é capaz de identificar uma música imediatamente, mas quando o faz, os resultados são muito bons.

“Mais da metade das músicas de um amplo conjunto de variáveis ​​(tom, altura, volume, etc.) são reconhecidas por nossos algoritmos, mas é claro, a precisão depende da qualidade do zumbido, do tipo de música e muito mais “, disse o porta-voz do Google Lifewire em um e-mail. “Mas, uma vez que seja reconhecido, cerca de quatro das cinco respostas estão corretas.” No entanto, esta não é a primeira vez que o zumbido é usado em um aplicativo de identificação de música.

SoundHound oferece um recurso semelhante, conforme observado pela CNN Business, e também está disponível para Android e iOS. De acordo com o porta-voz do Google, o novo recurso não levanta nenhuma preocupação com a privacidade, nem “muda a maneira como o Google lida com interações baseadas em áudio”, disseram eles Lifewire em um e-mail.

Aprendizado de Máquina

Apesar da simplicidade do conceito, cantarolar uma melodia para encontrar a gravação em estúdio é tecnicamente muito difícil. Existem várias razões para isso, explica Christian Frank, do Google Research, em uma postagem no blog de 12 de novembro. Em primeiro lugar, uma versão cantarolada da música pode ser muito diferente da gravação real, tornando difícil combinar as duas. Portanto, embora o Shazam e uma série de outros aplicativos já existam para identificar aquela música que você ouve em um restaurante ou outro local público, usar uma melodia cantarolada como base para essa busca pode ser mais complicado.

“Com letras, vocais de fundo e instrumentos, o áudio de uma gravação musical ou de estúdio pode ser bem diferente de uma melodia cantarolada”, escreve Frank. “Por engano ou desígnio, quando alguém cantarola sua interpretação de uma música, muitas vezes o tom, tom, andamento ou ritmo podem variar ligeiramente ou mesmo significativamente.”

A visualização do Google de um clipe zumbido próximo a uma gravação de estúdio correspondente.

Google

Como as versões cantaroladas das canções podem ser muito diferentes das originais, Frank observa que muitos métodos anteriores exigiam a combinação do cantarolar de uma pessoa com uma versão da canção que tinha apenas uma melodia ou uma faixa que incluía um zumbido. Isso tornou os casos de uso do mundo real desafiadores, pois os bancos de dados com essas músicas podem ser limitados e precisam ser atualizados manualmente.

O Google explica que, para o recurso Hum to Search, ele usa modelos de aprendizado de máquina para transformar o áudio em uma “sequência baseada em números” que representa a melodia da música – o que ele diz pode ser considerado uma “impressão digital”.

Mais amigável

O uso de aprendizado de máquina no recurso Hum to Search do Google torna a ferramenta muito mais fácil de usar no mundo real. Como o Hum to Search combina a melodia cantarolada do pesquisador com a música real, a ferramenta é capaz de trabalhar com as novas músicas à medida que são lançadas, em vez de um banco de dados que precisa ser atualizado constantemente com versões zumbidas de cada faixa.

Além disso, você não precisa do pitch perfeito para usá-lo. “O sistema atual atinge um alto nível de precisão em um banco de dados de músicas que contém mais de meio milhão de músicas que estamos atualizando continuamente”, disse o Google em seu anúncio Hum to Search. “Este corpus de canções ainda tem espaço para crescer para incluir mais das muitas melodias do mundo.”