spot_imgspot_img

A IA de jogo do Google DeepMind acaba de encontrar outra maneira de tornar o código mais rápido


DeepMind compara a descoberta de AlphaDev a um dos movimentos estranhos, mas vencedores, de AlphaGo em sua partida Go contra o grande mestre Lee Sedol em 2016. “Todos os especialistas analisaram esse movimento e disseram: ‘Esta não é a coisa certa a fazer. Esta é uma jogada ruim’”, diz Mankowitz. “Mas, na verdade, foi a jogada certa, e o AlphaGo acabou não apenas ganhando o jogo, mas também influenciando as estratégias que os jogadores profissionais de Go começaram a usar.”

Sanders está impressionado, mas não acha que os resultados devam ser exagerados. “Concordo que as técnicas de aprendizado de máquina são cada vez mais revolucionárias na programação, e todos esperam que as IAs em breve sejam capazes de inventar algoritmos novos e melhores”, diz ele. “Mas ainda não chegamos lá.”

Por um lado, Sanders aponta que o AlphaDev usa apenas um subconjunto das instruções disponíveis no meeting. Muitos algoritmos de classificação existentes usam instruções que o AlphaDev não tentou, diz ele. Isso torna mais difícil comparar o AlphaDev com as melhores abordagens rivais.

É verdade que o AlphaDev tem seus limites. O algoritmo mais longo que produziu tinha 130 instruções, para ordenar uma lista de até cinco itens. Em cada etapa, o AlphaDev escolheu entre 297 instruções de montagem possíveis (entre muitas outras). “Além de 297 instruções e jogos de montagem com mais de 130 instruções, o aprendizado tornou-se lento”, diz Mankowitz.

Isso porque mesmo com 297 instruções (ou movimentos de jogo), o número de algoritmos possíveis que o AlphaDev poderia construir é maior do que o número possível de jogos no xadrez (10120) e o número de átomos no universo (cerca de 1080).

Para algoritmos mais longos, a equipe planeja adaptar o AlphaDev para trabalhar com instruções C++ em vez de montagem. Com um controle menos refinado, o AlphaDev pode perder alguns atalhos, mas a abordagem seria aplicável a uma gama mais ampla de algoritmos.

Sanders também gostaria de ver uma comparação mais exaustiva com as melhores abordagens desenvolvidas por humanos, especialmente para algoritmos mais longos. A DeepMind diz que isso faz parte de seu plano. Mankowitz quer combinar o AlphaDev com os melhores métodos desenvolvidos por humanos, fazendo com que a IA se baseie na intuição humana, em vez de começar do zero.

Afinal, pode haver mais aceleradores a serem encontrados. “Para que um humano faça isso, é necessário um conhecimento significativo e uma quantidade enorme de horas – talvez dias, talvez semanas – para examinar esses programas e identificar melhorias”, diz Mankowitz. “Como resultado, não foi tentado antes.”

Get in Touch

spot_imgspot_img

Related Articles

spot_img

Get in Touch

0FansLike
3,912FollowersFollow
0SubscribersSubscribe

Latest Posts