1 Saiba mais sobre o Content Capture

Os recursos de captura de tela do Oracle Content Management fornecem a você um sistema para capturar, indexar, armazenar e gerenciar seu conteúdo essencial para os negócios. Você pode digitalizar e importar documentos em massa e processá-los automaticamente antes do upload para o Oracle Content Management. Documentos consistem em uma ou mais imagens obtidas de um scanner ou importadas de um arquivo ou podem ser arquivos eletrônicos, que não são de imagem, como arquivos do Microsoft Word ou PDF. Quando você importa arquivos que não são de imagem, o fluxo de captura definido determina se eles serão mantidos em seus formatos originais, convertidos em um formato de imagem ou impedidos de ser importados.

Os batches de documentos que você cria são escaláveis, permitindo reorganizar os documentos, automatizar o agrupamento deles de acordo com suas necessidades de negócios, ler códigos de barras para finalidades de faturamento ou arquivamento, indexar documentos para torná-los facilmente pesquisáveis e convertê-los nos formatos padrão da sua organização. Você cria workflows de captura de conteúdo ou procedimentos, que automatizam o processamento e o roteamento de documentos físicos e eletrônicos em massa.

Os drivers principais para capturar conteúdo são batches e documentos. Um documento é digitalizados ou importados e mantido em batches. Um batch consiste em imagens digitalizadas ou arquivos de documento eletrônico (como arquivos PDF ou do Microsoft Office) que são organizados em documentos e recebem valores de metadados (indexados). Cada documento compartilha um conjunto de valores de metadados. O Oracle Content Management fornece uma série de processadores de captura de conteúdo que importam documentos, os convertem em PDF e/ou em TIFF, reconhecem automaticamente códigos de barras, separam documentos automaticamente, preenchem valores de metadados e fornecem o resultado final ao Oracle Content Management.

O processo de captura de conteúdo envolve os seguintes componentes principais:

Capturar

A digitalização ou importação de documentos em batches como parte de um procedimento de captura de conteúdo pode ser feita de diversas maneiras:

  • Digitalização em alto volume usando um scanner de imagem de documento de produção

  • Digitalização ou importação remota ad hoc, como de um aplicativo de negócios

  • Importação automatizada, como de uma conta de e-mail ou pasta monitorada

Os usuários finais podem digitalizar manualmente documentos em cópia impressa ou importar documentos eletrônicos em batches usando o software Content Capture Client (com base em perfis de clientes criados pelos gerentes de procedimento). Como alternativa, usando definições armazenadas em um job de importação, o processador de importação pode também importar automaticamente imagens e outros documentos eletrônicos diretamente de e-mail, pastas da rede ou arquivos de lista.

Conversão

Dependendo das suas necessidades de negócios, talvez você precise converter em outro formato os documentos e anexos de entrada que não são de imagem. Por exemplo, relatórios de despesas em PDF anexados a mensagens de e-mail importadas podem precisar ser convertidos em formato de imagem para permitir que seus códigos de barras sejam lidos. Nesse caso, o processador de conversão em TIFF converte arquivos PDF em imagens TIFF. O processador de conversão em TIFF converte automaticamente documentos ou anexos e os mescla em um batch usando as definições armazenadas em um job de conversão. O processador de conversão em PDF converte documentos para PDFs do mesmo tipo de conteúdo do documento de origem e também em PDFs pesquisáveis.

Classificação

Classificação é o processo de separar batches em seus documentos lógicos e designar perfis de documento. O perfil do cliente especifica um conjunto de possíveis campos de metadados e tipos de anexo disponíveis a cada documento. A classificação envolve também designar um status a um batch.

A classificação pode ocorrer de forma manual ou automática e de várias maneiras:

Separação de Documentos

  • Manualmente pelos usuários do Content Capture Client. Por exemplo, os usuários podem selecionar um perfil do cliente configurado para um número específico de páginas por documento. Eles também podem inserir folhas de separação entre os documentos antes da digitalização para identificar um novo documento. Enquanto estão inspecionando visualmente um batch, os usuários do Content Capture Client podem criar novos documentos dividindo documentos maiores em diversos documentos menores.

  • Manualmente pelos usuários durante a importação de arquivo no Content Capture Client.

  • Automaticamente, quando o processador de importação importa documentos com base nas definições de job.

  • Automaticamente, durante o reconhecimento de código de barras pelo processador de reconhecimento. Se um batch for enviado ao processador de reconhecimento, o processador executará automaticamente o reconhecimento de código de barras e a classificação do documento.

Designação de Metadados

Os documentos são designados a um conjunto de valores de metadados com base em um perfil de documento chamado indexação. O perfil identifica os campos de metadados disponíveis para indexar um tipo específico de documento. Os valores de metadados podem ser designados de várias maneiras:

  • Manualmente, pelos usuários no painel de metadados do Content Capture Client.

  • Automaticamente, quando o processador de importação processa documentos com base nas definições do job.

  • Automaticamente, durante o processamento pelo processador de reconhecimento, com base nas definições do job.

  • Automaticamente, durante o processamento pelo processador de pesquisa de ativos, com base nas definições do job.

Os campos de metadados podem ser configurados de várias maneiras. Você pode configurar uma máscara de entrada e um formato de exibição ou fornecer uma expressão regular para validação. Os valores de metadados podem ser preenchidos automaticamente, selecionados nas listas de escolhas (ou derivados de códigos de barras) e nas listas de escolhas dependentes. Os gerentes de procedimentos configuram essas definições de campo de metadados no procedimento e depois as utilizam nos perfis do cliente ou nos jobs do processador.

Tipo de Anexo

Anexo é um arquivo, de imagem ou não, associado a um documento principal. Os gerentes de procedimento definem os tipos de anexo, que podem ser designados aos perfis de documento. Esses tipos de anexo podem ser usados para classificar anexos com documentos que foram designados a um perfil de documento. Os usuários do Content Capture Client podem exibir anexos, alterar um tipo de anexo, criar anexos e modificar anexos de imagem.

Status do Batch

Os gerentes de procedimentos definem status de batches conforme suas necessidades de negócios. O usuário designa a eles um batch manualmente a qualquer momento durante o processo de captura de conteúdo ou automaticamente por um dos processadores.

Liberação

O Oracle Content Management usa um método de bloqueio e liberação para assegurar que apenas um usuário ou processador tenha acesso a qualquer batch de captura de conteúdo a qualquer momento. Um batch é automaticamente bloqueado para você ao criar ou abrir (expandir) o batch. Você precisará liberar ou desbloquear o batch para torná-lo disponível aos outros. Quando você tiver terminado de trabalhar com um batch, libere-o ou desbloqueie-o. A liberação de um batch sincroniza automaticamente seus documentos e metadados com o Oracle Content Management e roteia o batch para processamento posterior (confirmação, reconhecimento ou conversão), se isso estiver configurado no perfil do cliente.

Confirmar

Quando um batch é confirmado, todos os seus documentos e metadados são submetidos a upload para o Oracle Content Management e depois removidos do batch. Isso permite que os documentos sejam localizados e acessados no Oracle Content Management por meio de seus metadados ou conteúdo. Alguns documentos podem não ser confirmados. Por exemplo, aqueles sem seus campos obrigatórios preenchidos são ignorados. Se todos os documentos em um batch forem confirmados, o batch também será excluído do procedimento.

Durante o processo de confirmação, os arquivos que não são de imagem que não foram convertidos em formato de imagem permanecerão em seus formatos originais.