Обзор библиотеки Apache POI - работа с приложениями пакета Microsoft Office в Java.

Обзор библиотеки Apache POI — работа с приложениями пакета Microsoft Office в Java

Apache POI — мощная библиотека для работы с различными документами пакета Microsoft Office на Java. Она включает API для чтения и создания новых документов Word, Excel, Visio, и работы с другими форматами файлов MS Office.

Интересный факт. Название библиотеки Apache POI является аббревиатурой от «Poor Obfuscation Implementation», что дословно переводится «Плохо Реализованная Обфускация» — это название было шуткой, придуманной программистами с хорошим чувством юмора, но позже оно стало официальным.

Кто не знает, обфускация — это намеренное запутывание кода для усложнения анализа структуры программы и алгоритмов при декомпиляции приложения.

Чтобы работать с Apache POI, ее нужно включить проект вашей программы. Если Вы используете maven, то можете добавить следующий код в зависимости проекта (выбирайте стабильную версию):

или же скачать ее на официальном сайте и вставить вручную.

При работе с библиотекой сразу бросаются в глаза необычные названия классов. Например, в классах для работы с Excel есть префикс HSSF: HSSFWorkbook, HSSFSheet и другие. Этот префикс HSSF расшифровывается как Horrible SpreadSheet Format или в переводе «Ужасный табличный формат»!

Давайте рассмотрим другие классы библиотеки Apache POI:

  1. Класс HSSF (Horrible Spreadsheet Format) используется для считывания и записи файлов Microsoft Excel формата xls.
  2. Класс XSSF (XML Spreadsheet Format) используется для считывания и записи файлов в формате Office Open XML (XLSX).
  3. Класс HPSF (Horrible Property Set Format) используется работы с базовой информацей о файлах пакета Microsoft Office.
  4. Класс HWPF (Horrible Word Processor Format) — для чтения и записи файлов приложения Microsoft Word 97 (формат .doc).
  5. Класс HSLF (Horrible Slide Layout Format) — для чтения и записи файлов приложения Microsoft PowerPoint.
  6. Класс HDGF (Horrible DiaGram Format) — для чтения и записи файлов приложения Microsoft Visio.
  7. Класс HPBF (Horrible PuBlisher Format) используется для работы с файлами Microsoft Publisher.
  8. Класс HSMF (Horrible Stupid Mail Format) используется для работы с файлами Microsoft Outlook MSG.
  9. Пакет DDF (Dreadful Drawing Format) используется для декодирования формата Microsoft Office Drawing.

Практика по Apache POI

Excel:

Word:

Добавить комментарий

Ваш e-mail не будет опубликован. Обязательные поля помечены *