Hay un par de formas en que puede ir aquí: muchas dependerán de si desea conservar la formateada (es decir, los párrafos y otros elementos de diseño) del PDF original.
Si está considerando soluciones comerciales, ofrecemos dos productos que pueden cumplir sus requisitos. Uno de ellos es EasyPDF SDK, que tiene llamadas de un solo disparo ExtractText() y ExtractText2() que sacan texto de sus archivos PDF como texto sin formato.
Tenga en cuenta que la salida de estas llamadas es bastante simple y perderá muchos de los elementos de diseño originales. Son agradables para la extracción de texto simple, pero pueden no ser excelentes si su PDF contiene datos tabulares.
Si está trabajando con tablas, una mejor alternativa podría ser desplegarlo como texto enriquecido. Tenemos una herramienta llamada EasyConverter SDK orientada para documentos comerciales que hace eso con una llamada de función única.
Con EasyConverter SDK, se conservará el diseño de su PDF original.
Ambos soportan C# así que no dude en consultar las versiones de evaluación en www.pdfonline.com si está interesado. Trabajo para el proveedor, así que tome esta sugerencia como una especie de madre que ama a su propio hijo :-) He estado navegando por stackoverflow.com en busca de fragmentos de código durante mucho tiempo, pero solo recientemente comencé a publicar, así que si tiene cualquier pregunta con cualquiera de las API solo házmelo saber y te puedo ayudar. ¡Aclamaciones!
+1 gratis es bueno. –