Google

lunes 23 de enero de 2012

Integración De Aplicaciones De Negocio Con El Gestor Documental


Son muchas las aplicaciones en las empresas que generan o requieren documentos ¿Cómo hacer para que todas las aplicaciones de negocio accedan y almacenen los documentos en un mismo lugar?


Cuando el equipo de desarrollo de Yerbabuena emprendió la tarea del desarrollo de Athento, una de las principales preocupaciones fue que el desarrollo de los componentes se hiciera siguiendo estándares que facilitaran integraciones con otras aplicaciones, ya fueran otros gestores documentales (para lo que se decidió implementar el estándar CMIS) u otras aplicaciones.

Abrir la posibilidad de interconectar Athento con otros sistemas era el primer paso, pero la segunda preocupación era reducir al máximo la necesidad de grandes desarrollos para lograr la conexión con otros sistemas.

Cuando se quiere conectar una aplicación de negocio con un gestor documental, las empresas se ven obligadas a realizar modificaciones tanto en el gestor como en las aplicaciones, de modo que se preparen ambos extremos del canal para poder comunicarse. El problema de los desarrollos no sólo es el tiempo y el dinero que consumen, sino que se encuentran sujetos a las versiones actuales de los sistemas. Una nueva versión del gestor y puede que el desarrollo que lo preparaba para conectarse con la aplicación de facturas quede inservible.

Al implementar el estándar CMIS, Athento soluciona una parte de la problemática, la del extremo del gestor. Athento se integra con el gestor documental (llámese Alfresco, Nuxeo, OpenText o cualquier otro que implemente CMIS) de manera que no haya que realizar modificaciones en él para prepararlo para la comunicación con las aplicaciones. Pero aún queda la parte de ajustar las aplicaciones (el otro extremo de la comunicación). En este punto, Athento evita de nuevo que se tengan que hacer modificaciones en el software. Para que esto sea posible, Athento Manager, es una capa que gestiona la comunicación de Athento con otras aplicaciones y gestores mediante la implementación de servicios.





Athento Manager implementa pues servicios de salida que permiten a Athento actuar sobre el repositorio documental y servicios de entrada que ayuden a las aplicaciones a consultar los documentos en el gestor. Podemos entender estos servicios como los canales de comunicación entre Athento y repositorio o Athento y aplicaciones. Así por ejemplo, si Athento necesita crear carpetas o documentos dentro de Alfresco utiliza su conector de salida de CMIS para crearlos. Y si la aplicación de facturas necesita consultar una factura de un cliente, Athento utiliza su conector de entrada REST para devolverle una representación de esa factura.


Los conectores para las aplicaciones los puede desarrollar el departamento técnico de la empresa, o los técnicos de Yerbabuena u cualquiera que sepa hacerlo, lo importante aquí es que nos olvidamos de hacer un desarrollo dentro de cada nuevo gestor, o cada vez que el repositorio cambie de versión, o uno por cada aplicación que necesite consultar documentos.





Con estos argumentos nos sentimos tranquilos al decir que Athento es una aplicación altamente interoperable.






Contáctanos ahora!
Podemos ayudarte y mejorar la gestión documental de tu empresa.
Yerbabuena Software on LinkedIn

martes 17 de enero de 2012

Clasificando documentos con una tasa out-of-the-box del 80,85%

“Con una tasa de acierto out-of-the-box del 80,85% en clasificación automática de documentos Athento consigue digitalizar historias clínicas en un importante hospital del país. Esta es una tasa muy elevada, considerando que el sistema no tuvo entrenamiento previo ”

Durante el pasado diciembre estuvimos realizando pruebas sobre Athento en un importante hospital de Andalucía. El objetivo era demostrar el desempeño de Athento en la digitalización de historias clínicas. Los resultados han sido muy buenos. En una mañana, se instaló Athento y se procedió a digitalizar un conjunto de historias clínicas. Vamos a describir un poco las características de las pruebas.
Se tomó una muestra de 12 historias clínicas. Estas historias clínicas (H.C en adelante) contaban con más de 20 tipos documentales distintos, pero para las pruebas se tomaron sólo 8 tipos distintos de documentos:
  • Consentimientos informados
  • Analíticas (distintos tipos)
  • Informes (naturaleza diversa)
  • Informe de Urgencias
  • Observaciones acerca del Curso Clínico
  • Hoja de estadística Clínica
  • Informe de alta
  • Gráfica diaria
Los documentos que componían las H.C se encontraban en diversas condiciones y calidades. Athento consiguió clasificar correctamente 76 documentos de 94.
Los sistemas de reconocimiento y clasificación de documentos como el que tiene Athento requieren de un periodo de entrenamiento del sistema para alcanzar su máxima tasa de acierto, que en el caso de Athento se encuentra en el 98%. Por entrenamiento podemos entender un periodo clasificando documentos de manera que el sistema vaya refinando su capacidad de identificación de documentos. El aspecto más destacable de la prueba, es que sin este periodo de entrenamiento, Athento (en frío, por llamarlo de alguna manera) ha conseguido una tasa de acierto muy alta.
Para clasificar un documento, Athento lleva a cabo el siguiente proceso:




Athento analiza la estructura de la imagen y la asocia a un tipo de documento por sus características, posteriormente aplica el OCR para convertir el texto de la imagen en texto real que luego analiza semánticamente buscando patrones que puedan pertenecer a determinado tipo documental. A estas alturas del proceso Athento ya se encuentra listo para discernir el tipo de documento que ha sido capturado; pero todo este proceso ya os lo explicaremos con más detalle ¡en otro post!


Contáctanos ahora!
Podemos ayudarte y mejorar la gestión documental de tu empresa.

Yerbabuena Software on LinkedIn

lunes 9 de enero de 2012

¿Por qué aplicar Semántica a la Gestión Documental?


"La Semántica comienza a vislumbrarse como la aliada de la gestión documental para hacer frente a la sobre población digital que vivimos"



Hoy en día trabajamos y compartimos toda clase de información digital. Buscamos cuanto necesitamos en internet, tenemos información disponible por doquier. Con tanta información comienza a ser más difícil cada vez más encontrar lo que estamos buscando. Según un estudio de McAfee en 10 países distintos y con una muestra de 3000 usuarios de las nuevas tecnologías, en promedio cada una de esas personas tiene 2777 archivos digitales almacenados en al menos un dispositivo.

Si multiplicamos esta cifra por ejemplo por los empleados de una empresa de 50 trabajadores, ya tenemos un volumen de 138850 ficheros. Los sistemas DMS o ECM nos ayudan a mantenerlos organizados, a no perderlos, a deshacernos del papel, pero la verdad, cada vez se hace más difícil encontrar de manera rápida aquello que necesitamos, y peor, cada vez es más difícil sacar provecho de la información contenida en los documentos de las empresas, pues son tantos que es difícil construir conocimiento a partir de ellos.

Tampoco es fácil hoy en día encontrar un documento o archivo usando los datos tradicionales por los cuales lo identificamos, como su nombre, autor o fecha de creación, pues estos no son precisamente datos que las personas recordemos con precisión.

Es para ayudarnos a solventar todas estas dificultades que aparece la semántica. Definiendo descripciones sobre documentos o entidades como personas, empresas, países, o simplemente, cualquier dato relevante dentro de los documentos, y consiguiendo asociar dichos documentos porque comparten esas entidades o contenido similar, podemos mejorar drásticamente los mecanismos que tenemos para recuperar documentos o encontrar información acerca de algo que necesitemos.



Vamos a verlo con un ejemplo, en la siguiente imagen se pueden ver dos mecanismos distintos para encontrar un documento. 
La imagen de la derecha es un formulario tradicional que nos pide que recordemos datos precisos, como título, descripción o rango de fechas de creación. En la parte derecha vemos una nube de tags. Si pinchamos en un término de esa nube de tags iremos a un conjunto de documentos cuyo contenido se encuentra relacionado con dicho término. 
¿Cuál método es más efectivo? Bueno, depende de si sabemos con precisión todos los datos del documento, lo malo es que no siempre sabemos todos esos datos de nuestros 2777 archivos en promedio por persona. ¿Cuál método es más rápido? Un clic siempre va a ser más rápido, por supuesto, que rellenar un formulario. 
Pero el secreto no está en el mecanismo de búsqueda utilizado, eso no es un ejemplo de semántica, la mayoría de sistemas gestores de documentos nos ofrecen la posibilidad de etiquetar documentos; la diferencia viene cuando es el propio sistema el que logra entender el contenido de los documentos e identificar en él la información que es relevante, para luego, relacionar todos aquellos documentos que tratan sobre ese mismo contenido. Ahí está la semántica, cuando el sistema logra entender que un documento trata sobre innovación y que debe agruparlo con otros que también tratan el tema.



La semántica pues, en este ejemplo concreto, nos ahorra trabajo como tener que pensar cuales son las palabras que resumen el contenido del documento y nos ayuda a encontrar más rápido aquellos otros documentos que también podríamos querer revisar porque tratan la misma temática.
Este es sólo un ejemplo de semántica aplicado a la gestión documental (Autotagging en Athento iDM), pero comienzan a desarrollarse otras muchas aplicaciones que poco a poco irán consiguiendo que nos sea menos complicado movernos entre tanta información.


Contáctanos ahora! Podemos ayudarte y mejorar la gestión documental de tu empresa.
Yerbabuena Software on LinkedIn

miércoles 28 de diciembre de 2011

¿Cómo gestionar 7.000.000 de documentos? Athento en Clúster

¿Cómo permitir la integración de diversas aplicaciones de manera que puedan trabajar sobre 7.000.000 de documentos sin duplicarlos?¿cómo tener un sistema lo suficientemente potente como para responder a las constantes consultas o solicitudes de tantas aplicaciones?

Durante 2011 hemos estado trabajando con un importante cliente del sector financiero a nivel mundial. Su problema era básicamente que tenían una gran cantidad de documentos que gestionar y aplicaciones software distintas que trabajaban con los mismos documentos, cada una con su propio repositorio documental. Por supuesto, tener los mismos documentos en distintos repositorios genera dificultades a la hora de mantener el sistema e inconsistencias en la documentación, además de que, por supuesto, dificulta el aprovechamiento de la información contenida en los documentos e incluso da lugar a que estos se extravíen o se pierda trabajo realizado sobre ellos.

Asesoramos a nuestro cliente para que se decantara por una solución que les permitiera no sólo conectar todas las aplicaciones, sino que además, no les hiciera dependientes de un DMS (Document Mangement System) en particular. La alta capacidad de integración y escalabilidad de Athento iDM en este punto fue crucial, puesto que podría funcionar con cualquier gestor documental que cumpliera con los estándares si en un futuro se decidía migrar a otro repositorio y, al mismo tiempo, mediante Web Services permitiría la comunicación y transferencia de datos con las actuales aplicaciones y con futuras. Haciendo uso de la interfaz web de Athento, un Sistema de Gestión Documental Inteligente (IDMS), las aplicaciones y sus casi 200 usuarios podrían crear , consultar y modificar documentos que se guardarían en Nuxeo DM 5.4.2., el DMS elegido.

Al mismo tiempo, Athento posibilitaría la conexión entre las distintas aplicaciones y el repositorio documental.



El rendimiento del sistema era otro de los puntos claves, por eso se optó por implementar Athento en clúster. Dos instancias de Nuxeo (en máquinas virtuales Linux de 64 bits) corriendo sobre un mismo equipo físico permitirían una gestión rápida de un único repositorio documental que almacenaría todos los documentos, pero además, se utilizaría un Balanceador cuya función sería determinar cual de las dos instancias del gestor documental (Nuxeo) tenía menor carga de trabajo para enviarle las peticiones y consultas de las aplicaciones del sistema global, de manera que nunca una de las instancias colapsara por exceso solicitudes.

De esta manera nuestro cliente consiguió contar con un sistema estable con casi 600.000 accesos que les permite mantener en todo momento la información actualizada y consistente y, también, acceder a ella a una velocidad media de 4 segundos desde cualquiera de las aplicaciones o desde la interfaz de Athento.






Contáctanos ahora!
Podemos ayudarte y mejorar la gestión documental de tu empresa.
Yerbabuena Software on LinkedIn

viernes 23 de diciembre de 2011

Yerbabuena Software y Athento os desean una Feliz Navidad y un Prospero Año Nuevo!


Antes que nada, ahora que se acaba el año queremos darlos la gracias por la confianza. Empezamos el año con 2000 visitantes únicos y lo hemos finalizado siendo el blog de referencia de gestión documental en el mundo de habla hispana.

Hemos sido los primeros en hablar de semántica y hoy ya reconocéis a Athento como al primer Gestor Documental Inteligente (IDMS).

Nos visitáis desde 64 países distintos en todo el mundo y eso nos hace sentirnos llenos de orgullo y felicidad, y hace a nuestros técnicos levantarse todos los días y desarrollar funcionalidades que ayudan a hacer tu trabajo diario mejor.

Por todas estas razones, gracias, porque vosotros sois el motor que impulsa a esta empresa Malagueña y que la ha llevado desde el mediterráneo hasta el océano Pacífico en el Valle del Silicio.

Gracias a todos por hacernos mejores y sólo nos resta desearos una Navidad llena de regalos, de ilusión, de amor y un 2012 plagado de éxitos, de salud, de amor y de dinero.

De regalo os dejamos nuestro Christmas y esperamos que los reyes os traigan un Athento este Enero, eso si que sería comenzar el año bien!




Contáctanos ahora!
Podemos ayudarte y mejorar la gestión documental de tu empresa.
Yerbabuena Software on LinkedIn

miércoles 21 de diciembre de 2011

5 Mitos sobre la Automatización de Documentos

Todas las organizaciones producen documentos, algunas incluso cientos o miles por día. La información contenida en estos documentos es a menudo vital para la empresa - de la producción de presupuestos de ventas, políticas y procedimientos a contratos de trabajo o de ámbito comercial. Mientras que algunos contenidos en estos documentos cambia, otros aspectos, tales como su estructura y la forma en que se le da formato, no puede. En otras palabras, muchos documentos contienen contenido repetitivo que cambia poco de un documento al siguiente y el contenido variable debe ser personalizado con precisión.  La automatización de documentos puede simplificar la creación del documento empresarial más simple o complejo, pero muchas empresas están confundidos en cómo hacerlo. A continuación se presentan cinco  mitos que las organizaciones tienen que pensar a la hora de considerar cómo manejan la creación de documentos.

Mito # 1: la automatización de documentos es sólo Word Merge (combinar con Word).

Realidad: Microsoft ® Word mail merge (combinación de correo) es una aplicación de escritorio que permite a los usuarios crear grandes volúmenes de documentos llenando de "merge fields" (campos de fusión) las plantillas de extracción de datos de fuentes externas, tales como hojas de cálculo Microsoft Excel, bases de datos Microsoft Access o de otro tipo de recursos estándares como OLE DB / ODBC. Como no es una aplicación de servidor (aplicación web) de combinación de correspondencia, se procesa en el escritorio del usuario final y los documentos resultantes se guardan en el escritorio, en un sistema de archivo o se imprimen directamente por el usuario final. El rendimiento de la aplicación también está limitado por la máquina del usuario y puede "petar" su equipo durante largos períodos de tiempo. Más importante aún, no se puede lograr escalabilidad. La funcionalidad de combinación de correspondencia sólo puede ser mejorada mediante el uso de scripts VB (Visual Basic) a medida para cada aplicación / plantilla  de mail merge. Esto puede aumentar los costes de creación y mantenimiento de plantillas, así como que las propias plantilla sean más complejas. Además de esto, si las plantillas están sujetas a un flujo de trabajo, una aplicación adicional se deben implementar para gestionar las necesidades de edición, auditoría y aprobación. Microsoft Word no es por lo tanto ideal para la producción de documentos de alto volumen automático debido a las limitaciones en las capacidades de escalabilidad y producción de documentos no tripulados.

En general, Microsoft Word mail merge satisface las necesidades de producción de documentos de un individuo o pequeña empresa / departamento, de la misma manera que Microsoft Word como editor de texto permite una personalización completa de los documentos. Sin embargo, su implementación como una solución corporativa para la creación de documentos es cuestionable como la edición manual de documentos y la personalización mediante el uso de campos complejos en las plantillas es propenso a errores, algo que no es aceptable cuando los documentos se crean de cara al cliente.

Mito # 2: Mi contratos / presupuestos son perfectos.

Realidad: Lo que sucede como normal en los sistemas de gestión documental corporativos es a menudo una "barra libre" de procedimientos rotos, bypass de controles y números inexactos. Los documentos creados a través de todos estos procesos, tan comunes como los contratos por ejemplo, a menudo dejan a las empresas abiertas a penalizaciones y responsabilidad legal. La causa no es la negligencia, sino la tecnología inadecuada.

La mayoría de las empresas tienen reglas de negocio en torno a la preparación de documentos para minimizar su exposición al riesgo. Muy pocas tienen un sistema cohesionado para la aplicación de normas cuando los documentos son creados en realidad en los escritorios de los empleados. Las reglas y procedimientos están bien, pero cuando no hay manera de expresarlas a través de los sistemas de tecnología utilizados para crear documentos, son fáciles de eludir - deliberada o accidentalmente. Al final, la mayoría de las empresas tienen un control más eficaz sobre sus procesos para la compra de suministros de oficina que para la creación de documentos jurídicamente vinculantes.

Esta falta de control en el front-end (zona frontal, comienzo) del proceso de gestión de documentos - la creación del documento actual - deja a las empresas abiertas al riesgo. Como cualquier persona involucrada en la creación de documentos sabe, una frase equivocada puede costar millones a la empresa. Una automatización de documentos insuficiente o inexistente aumenta las probabilidades de que la frase equivocada termine en el contrato. Las empresas responden al riesgo de dos maneras. Quienes son serios sobre la reducción de su exposición al riesgo buscan productos que mejoren su front-end de preparación de documentos. Quienes no, tratan de reducir su exposición emitiendo más notas y  más procedimientos para tener una negación plausible si algo sale mal, algo que ocurre a menudo.

Mito # 3: Está bien si mi comercial pasa cuatro horas con la creación de un presupuesto (cotización).

Realidad:  De acuerdo con Gartner Group, los documentos consumen hasta el 60 por ciento del tiempo de oficina de los trabajadores y representan hasta el 45 por ciento de costos de mano de obra - demasiado tiempo centrado en tareas mundanas y rutinarias frente a centrarse en el núcleo y en proporcionar ingresos. Para conocer el tiempo malgastado en su propia organización considere estas preguntas: ¿Cómo son los documentos creados en su negocio? Copiar y pegar? Construídos desde cero cada vez? O, construídos a partir de plantillas de usuario poco amigables donde se introduce toda la información a mano (incluso si ya la tienes en otro sistema) y no puede ser validado o repetido (por lo que si el nombre de un cliente aparece dos veces, tienes que ponerlo dos veces) o tienes reglas de negocio y lógica aplicada? Ninguno de estos métodos es eficaz y preciso. Consumen mucho tiempo, son propensos a errores, y casi garantizan crear más problemas en el futuro. Los costes de las entradas se incrementan, y sufre la productividad. Al automatizar el proceso se logra tener una creación de documentos más eficiente y precisa. Los enfoques de copiar y pegar, y construir desde cero son eliminados.


Contáctanos ahora! Podemos ayudarte y mejorar la gestión documental de tu empresa.

Yerbabuena Software on LinkedIn