Arquivos online para edições impressas de jornais

ou qualquer outro tipo de publicação.

Embora muitas publicações já tenham os seus arquivos digitalizados, não possuem uma boa solução para disponibilizá-los aos seus leitores.

O objectivo deste protótipo é habilitar qualquer publicação, de nível local a internacional, a colocar os seus arquivos impressos online, focando-se em três funcionalidades principais:

  1. 1Visualização
  2. 2Extracção de Texto
  3. 3Pesquisa

Um interface customizável oferece uma boa experiência de utilizador, não requerendo a um leitor download de ficheiros ou plugins adicionais, possibilitando a pesquisa e leitura imediata de qualquer página num arquivo.

Funcionalidades em Destaque

Plataformas Actuais e Futuras

Desenvolvido em tecnologias web e desenhado desde o início para adaptar-se a dispositivos móveis. Funciona em qualquer dispositivo que tenha um browser presente e possível de integrar noutros meios, como aplicações móveis nativas ou plataformas emergentes, como Realidade Virtual e Aumentada.

Pesquisar e Filtrar

Possibita a pesquisa de conteúdo num arquivo e filtragem por intervalos temporais. A pesquisa pode ser personalizada à língua de publicação e outras preferências, como detectar erros ortográficos e sinónimos.

Partilha em Redes Sociais

Cada página de um arquivo torna-se um objecto social, optimizado e pronto para ser descoberto ou partilhado nas redes sociais. É, também, possível optar ter o arquivo indexado em motores de busca.

Monetização

Os arquivos de publicações são ativos que podem e devem ser monetizados, podendo ser fornecidos como um valor adicional a um subscritor, com uma melhor experiência de utilização.

Alojamento

Desenhado para ser uma solução economicamente viável mesmo para pequenas publicações. Com a possibilidade de escolher o serviço de alojamento, com ficheiros alojados por omissão no serviço Amazon S3, ou outras opções como Google Cloud Storage e DreamObjects.

API

Uma API básica é fornecida para uploads em massa de arquivos e outras funcionalidades. Extensível para suportar mais funcionalidades e integração com os serviços existentes de autenticação, ou outros, de uma publicação para, a título de exemplo, restringir acesso ao subscritor.

Reconhecimento de Texto

As imagens digitalizadas de arquivo são processadas utilizado reconhecimento de texto de última geração, recorrendo a Microsoft Azure Cognitive Services Computer Vision. Opções adicionais em breve de utilizar Google Cloud Vision e Tesseract.

Correcção de Texto

Para texto que não seja reconhecido corretamente, foi desenvolvida uma solução de crowdsourcing que permite aos leitores, ou outros, estarem envolvidos no processo de correcção de quaisquer erros ortográficos.

Documentação

Para apoiar na instalação, documentação é fornecida, especificando as principais funcionalidades do software e como pode ser adaptado ao vosso arquivo e leitores.

Código Aberto

Desenvolvido em tecnologias como Ruby On Rails, Leaflet e Elasticsearch, com o código-fonte disponível no GitHub, numa licença GPLv3. Localizações disponíveis em Português e Inglês.

falta uma frase final a indicar outros features a explorar

ContactoServiços de instalação e personalização disponíveis