Возможно ли получить определенные данные из таблицы excel (из столбца или строки) с использованием apache tika в java?

Существует простой способ извлечения данных, которые, как мне кажется, только извлекают его как текст (используя toSting() ), но я хочу получить данные в соответствии с указанным именем столбца или строки. Ниже приведен пример кода, который просто печатает содержимое MS Excel вместе с его метаданными (избегайте этой части). Он использует tika-app-1.13.jar (если вы хотите запустить этот код, добавьте эту библиотеку)

 import java.io.File; import java.io.FileInputStream; import java.io.IOException; import org.apache.tika.exception.TikaException; import org.apache.tika.metadata.Metadata; import org.apache.tika.parser.ParseContext; import org.apache.tika.parser.microsoft.ooxml.OOXMLParser; import org.apache.tika.sax.BodyContentHandler; import org.xml.sax.SAXException; public class MSExcelParse { public static void main(final String[] args) throws IOException, TikaException, SAXException { //detecting the file type BodyContentHandler handler = new BodyContentHandler(); Metadata metadata = new Metadata(); FileInputStream inputstream = new FileInputStream(new File("C:\\Users\\Username\\IdeaProjects\\Tika\\src\\example.xlsx")); ParseContext pcontext = new ParseContext(); //OOXml parser OOXMLParser msofficeparser = new OOXMLParser(); msofficeparser.parse(inputstream, handler, metadata, pcontext); System.out.println("Contents of the document:" + handler.toString()); System.out.println("Metadata of the document:"); String[] metadataNames = metadata.names(); for (String name : metadataNames) { System.out.println(name + ": " + metadata.get(name)); } } } 

example.xlsx содержит данные (любезно перейдите по ссылке, чтобы увидеть данные)

Что я хочу спросить, хочу ли я извлечь / извлечь только данные из let say, столбец «age» с использованием Apache Tika в Java, есть ли способ сделать это?

Я считаю, что это ответит на все ваши вопросы. http://poi.apache.org/spreadsheet/quick-guide.html#ReadWriteWorkbook

  • Получение java.lang.NullPointerException при записи в рабочую книгу WorkBook.write (out) Apache POI
  • Дублирование ячеек формулы Apache POI очень медленное
  • import Дата из базы данных в лист Excel
  • Два разных WritableCellFormat для одной метки или cel
  • Расчет уровня заполнения бака через SQLite
  • Как читать значение каждой ячейки в строке листа Excel, если значение 1-й и последней ячейки равно Null или Пустое?
  • Недопустимое исключение: внешние ссылки HSSF-типа не поддерживаются для XSSF
  • От MySQL до XLS с DataNucleus (java)
  • r - ошибка с использованием пакета xlsx в write.xlsx
  • Почему метод Apache POI OPCPackage close () не сохраняет / не записывает содержимое, чтобы открыть файл с возможностью записи?
  • Использование стиля ячейки
  • Interesting Posts
    Давайте будем гением компьютера.