ORC e Redes Neurais em JavaScript
Posted by Dirceu | Filed under html-5, javascript, rede-neural, getimagedata, captcha, traducao, ocr, uncategorized
Esse texto é uma tradução do "OCR and Neural Nets in JavaScript" escrito por John Resig.
Um belo pedaço de JavaScript foi criado ontem. É um script para GreaseMonkey escrito por 'Shaun Friedle' que resolve automaticamente o captcha do Megaupload. Existe uma demonstração online caso você queira dar uma olhada.
Atualmente os captchas usados no Megaupload não são muito "difíceis" de resolver (de fato eles são muito ruins - exemplos abaixo).



Existem porém pontos interessantes aqui:
- A API getImageData do HTML 5 é usada para pegar informações sobre os pixels da imagem. No HTML 5 é permitido adicionar uma imagem no elemento canvas (de onde então pose-se extrair informações sobre cada pixel usando JavaScript).
- O script implementa uma rede neural, escrita em puro JavaScript.
- As informações do pixel, extraídas da imagem usando canvas, são jogadas dentro da rede neural em uma tentativa de adivinhar o caractere usado - algo parecido com Optical Character Recognition (OCR).
Se abrirmos o código fonte podemos perceber que o funcionamento recai em como o captcha é implementado. Como mencionado anteriormente esse não é um captcha muito bom. Ele tem 3 letras, cada uma em uma cor diferente ...