Graças a uma pessoa, o mundo ganhou 12 milhões de fotos históricas digitalizadas

Ilustração de 1873.
Imagem: Internet Archive Book Image/Flickr, 1873.

Contar histórias não é uma exclusividade das palavras. Imagens podem dizer muito também. Assim pensa Kalev Leetaru, da Universidade de Georgetown, responsável por extrair 12 milhões de fotos e ilustrações históricas de uso livre e pesquisáveis a partir de 600 milhões de páginas de livros.

Leetaru alterou o software usado pelo Internet Archive para digitalizar livros, incluindo nele a capacidade de separar, extrair e etiquetar imagens. Até então o programa convertia o texto em PDF e descartava o material visual. Segundo o próprio:

Durante todos esses anos as bibliotecas têm digitalizado seus livros, mas tratado eles como PDFs ou trabalhos de texto pesquisáveis. Elas têm focado nos livros como uma coletânea de palavras. Isso [o software] inverte a situação.

As imagens estão sendo enviadas a um perfil no Flickr, que já conta com quase 3 milhões delas. Ainda há muito trabalho pela frente e Leetaru espera que seu software seja usado por outras bibliotecas ao redor do mundo a fim de preservar e difundir imagens que, de outra forma, estariam fadadas à clausura e degradação do tempo.

Via The Wire.

Robôs (tuitando) entre nós

Zachary M. Seward, na Quartz:

Quando o Twitter se preparava para seu IPO ano passado, 7% dos seus usuários ativos usavam a API [leia-se não acessavam o serviço pelos clientes oficiais]. A empresa também disse (p. 49) que esperava que essa porcentagem “diminuísse com o tempo, especialmente na medida em que o uso dos nossos aplicativos móveis crescesse.”

Na verdade, a porção dos usuários ativos por mês do Twitter que usa a API dobrou, para 14%. Aquele segmento de usuários cresce muito mais rapidamente do que os usuários ativos por mês que não usam a API do Twiter. Eles representam hoje 37,9 milhões de contas ativas, 148% a mais do que no ano passado.

Quarta o Twitter revelou o balanço financeiro do trimestre e, ante o aumento de 6,3% na base de usuários (271 milhões), suas ações dispararam. O humor dos investidores parece estar atrelado a esse critério, embora seja um bem ruim dadas as peculiaridades do serviço — problema bem explicado no texto acima.

Mais curioso, porém, é como a presença de bots em ambientes considerados humanos na Internet vem aumentando. Se no Twitter os bots formam uma parcela considerável, na web eles já são maioria. Em dezembro do ano passado, pela primeira vez na história a quantidade de bots/scripts navegando em sites superou a de seres humanos. A Incapsula, uma empresa especializada em rastrear bots, aferiu que 61,5% do tráfego na web era realizado por máquinas.

O próximo Internet Explorer do Windows Phone terá gostinho de maçã

Paul Thurrott, sobre as novidades do IE no Windows Phone 8.1 Update:

O que eles mudaram? Primeiro e mais importante, aceitaram a realidade: páginas web modernas são projetadas e construídas para o iOS (Safari) e Android (Chrome), e não para os padrões abertos aos quais o IE recorre.

O mesmo Internet Explorer que ditava o rumo da web há dez anos, hoje faz gambiarras para exibir corretamente páginas que usam soluções proprietários de Apple e Google. E não só: o IE do Windows Phone 8.1 passará a se identificar aos sites como se fosse o Safari.

O blog oficial do IE traz informações mais técnicas e vários exemplos de “antes e depois”.

O mundo dá voltas.

Buscador do Baidu estreia no Brasil

Saulo Pereira Guimarães, na Exame:

Uma cerimônia realizada hoje em Brasília marcou o lançamento da versão brasileira do Baidu, serviço de buscas mais usado na China.

No evento, estiveram presentes a presidente Dilma Rousseff, o presidente chinês Xi Jinping e Robin Li, chefe executivo do Baidu – entre outros.

“Nossa entrada no mercado brasileiro servirá para torná-lo mais competitivo, impulsionando a inovação local e proporcionando mais e melhores opções para os brasileiros”, afirmou na cerimônia Johnson Hu, diretor de negócios internacionais do Baidu.

A versão localizada está em br.baidu.com. Estranhamente, baidu.com não redireciona automaticamente para o site brasileiro. Ele é limpo e bem direto, filtra resultados por imagens e vídeos, e traz um mecanismo que tenta adivinhar os termos enquanto são escritos e outro que parece uma espécie de ranking de notícias mais populares do momento. Do lado esquerdo flutuam links para o Postbar, uma espécie de fórum online sobre temas segmentados. Não fiz testes suficientes para ter uma noção da qualidade do algoritmo que retorna os resultados.

O buscador do Baidu é o maior produto da empresa chinesa. Líder na China, responde por 70% das pesquisas online feitas em seu país natal. Apesar de só agora trazer seu carro-chefe ao Brasil, a empresa Baidu atua por aqui há mais tempo.

Ano passado lançou diversos produtos, como antivírus, “otimizador” de PCs, o navegador Spark e um diretório de sites, o Hao123. A promoção deles tem sido agressiva, com publieditoriais em vários sites e a inclusão deles em instaladores de outros apps, tática no mínimo questionável e que até hoje rende críticas e comentários irritados de usuários afetados.

O lapso entre esses apps intrusivos e o buscador localizado talvez tenha uma razão de ser, como sugeriu o Emerson nesta nota do Tecnoblog no final do ano passado:

No evento [do início das operações no Brasil], a empresa justificou a aposta nestes aplicativos e a gratuidade de todos eles dizendo que, na fase inicial, a ideia é utilizá-los para conhecer melhor os hábitos dos usuários brasileiros. Exatamente como? Não disseram, mas dá para imaginar…

O lançamento em Brasília e com a presença dos presidentes do Brasil e da China me soa meio atípico. Ele faz parte dos esforços da China em difundir suas empresas de tecnologia no ocidente e em países orientais com fortes laços com esse lado do mundo. Em março, por exemplo, o presidente Xi Jinping fez visita à Coreia do Sul acompanhado dos CEOs do Baidu, Alibaba, Huawei e o chairman do Banco da China a fim de estreitar os lados em áreas como comércio, finanças, meio ambiente e assuntos diplomáticos.

O Baidu é mais um buscador que tenta derrubar a hegemonia do Google, que é especialmente alta no Brasil — diversos indicadores dão mais de 90% do mercado nacional ao serviço americano. E à luz das revelações de espionagem de Edward Snowden, feitas ano passado, o fato de ter sua sede em outro país que não os EUA parece um bônus interessante ao governo, mesmo ciente do histórico de interferências e censura do Partido Comunista da China na Internet do país.

Google sinalizará sites que usam tecnologias não suportadas, como Flash, nos resultados da busca

Do blog do Google para webmasters:

Um incômodo frequente para usuários da web é quando os sites exigem tecnologias do navegador que não são suportadas pelos seus dispositivos. Quando os usuários acessam páginas do tipo, eles podem ver nada além de um espaço em branco ou perder grandes porções do conteúdo da página.

A partir de hoje, indicaremos aos usuários do buscador quando nossos algoritmos detectarem que páginas que podem não funcionar em seus dispositivos. Por exemplo, o Adobe Flash não é suportado em dispositivo iOS e as versões 4.1 e posteriores do Android; uma página cujo conteúdo é formato na maioria por Flash será indicada assim:

Novas políticas para os resultados da busca.
Imagem: Google.

Quando escrevi sobre a última “falha” do Flash aproveitei para perguntar quando e onde o Flash ainda é utilizado. Esperava menos situações, mas uma coisa que me chamou a atenção foi que nenhum dos sites citados eram de conteúdo. São serviços multimídia, basicamente streaming de vídeo e música.

Com as técnicas e o suporte dos navegadores modernos a HTML5 e outras linguagens mais maleáveis, sobra pouca ou nenhuma justificativa para adotar em 2014 o Flash em, digamos, um site de cunho jornalístico. Paralelo a essa novidade, o Google anunciou duas fontes de recursos para auxiliar eventuais migrações, o Web Fundamentals e o Web Starter Kit.

O emprenho do Google em desestimular o uso dessas tecnologias é positivo, mais um passo para que, gradualmente, Flash, Java e outras tecnologias deem lugar a padrões mais avançados. A grande virada deverá ocorrer quando o Chrome para desktop abandonar o Flash, que há quatro anos vem integrado no navegador.

No aniversário de 25 anos da web, Tim Berners-Lee luta pela liberdade da Internet

Em 1989, de sua sala no CERN, em Genebra, Tim Berners-Lee escreveu uma proposta de sistema com o intuito de facilitar a comunicação dentro da instituição. Um sistema tão genialmente concebido que não demorou muito para que seu criador visse nele algo com muito mais potencial do que uma ferramenta para comunicação interna. Algo que conquistaria o mundo.

O aniversário da web foi muito celebrado, com todos os méritos, na última quarta-feira (12), data em que há 25 anos Berners-Lee escreveu a proposta de web. Ela conseguiu, em um quarto de século, acumular uma quantidade inestimável de conhecimento, construir e destruir grandes nomes, dar voz a quem, de outra forma, falaria para poucos ou acabaria no silêncio.

Continue lendo “No aniversário de 25 anos da web, Tim Berners-Lee luta pela liberdade da Internet”

Do NOT follow this link or you will be banned from the site!