Экспорт табличных данных из PDF в редактируемый формат

Иван Корнев·10.04.2026·4 мин

Чтобы перенести таблицу из PDF в Excel без потери структуры, используйте встроенную функцию «Данные > Получить данные > Из файла > Из PDF» (доступна в Excel 2016+ и Office 365). Это самый надежный метод для цифровых документов. Если файл является отсканированным изображением или защита запрещает копирование, потребуются сторонние конвертеры с OCR или ручное распознавание текста. Ниже приведены детальные инструкции для всех сценариев.

Краткий итог: Для обычных файлов используйте встроенный импорт Excel. Для сканов — сервисы с OCR (Adobe, OnlineOCR). Для регулярной обработки больших объемов — настройте запрос в Power Query.

Встроенный инструмент импорта в Excel

Начиная с версии 2016, Microsoft Excel имеет нативный движок для чтения таблиц из PDF. Это предпочтительный способ, так как он не требует загрузки данных на сторонние серверы и сохраняет типы данных (числа, даты).

Алгоритм действий:

  1. Откройте чистый лист в Excel.
  2. Перейдите на вкладку Данные (Data).
  3. Выберите Получить данныеИз файлаИз PDF.
  4. Укажите путь к вашему документу.
  5. В окне навигатора отобразится список всех найденных таблиц (Table001, Table002 и т.д.). Кликните по нужной, чтобы увидеть превью.
  6. Нажмите Преобразовать данные (Transform Data), если нужно почистить лишние строки, или Загрузить, если структура идеальна.

Если в превью вы видите «кашу» из символов, а не четкие столбцы, значит, ваш PDF — это картинка (скан). В этом случае встроенный инструмент не сработает напрямую, переходите к разделу про OCR.

Онлайн-конвертеры для разовых задач

Если у вас старая версия Excel или нужно быстро обработать файл на телефоне/планшете, воспользуйтесь веб-сервисами. Они используют облачные алгоритмы распознавания.

Популярные решения:

  • SmallPDF / ILovePDF: Автоматически определяют границы таблиц. Удобны для файлов до 10–20 Мб.
  • Adobe Acrobat Online: Официальный инструмент от создателей формата. Часто дает наилучшее сохранение форматирования ячеек.
  • Zamzar: Поддерживает пакетную конвертацию.

Инструкция:

  1. Зайдите на сайт сервиса.
  2. Перетащите PDF-файл в область загрузки.
  3. Дождитесь обработки и скачайте результат в формате .xlsx или .csv.
  4. Откройте файл в Excel и проверьте корректность данных.

Конфиденциальность: Не загружайте документы, содержащие персональные данные, паспортные сведения или коммерческую тайну, на бесплатные публичные сервера. Файлы могут храниться на их дисках от 1 часа до суток.

Работа со сканированными документами (OCR)

Если таблица в PDF является изображением (например, отсканированный бумажный отчет), обычные методы скопируют её как одну большую картинку или набор неструктурированных букв. Здесь необходимо оптическое распознавание символов (OCR).

Вариант А: Google Документы (Бесплатно)

  1. Загрузите PDF на свой Google Диск.
  2. Нажмите правой кнопкой мыши на файл → Открыть с помощьюGoogle Документы.
  3. Система автоматически распознает текст и попытается воссоздать таблицу.
  4. Скопируйте полученную таблицу и вставьте в Excel.

Вариант Б: Специализированный софт

Для сложных случаев (плохое качество скана, рукописные пометки) используйте:

  • ABBYY FineReader: Лидер рынка по точности распознавания русских таблиц.
  • Microsoft OneNote: Вставьте картинку таблицы в заметку, кликните правой кнопкой → «Копировать текст из рисунка».

Автоматизация через Power Query

Если вам нужно регулярно переносить таблицы из однотипных отчетов (например, ежемесячные выписки банка), настройте автоматический запрос.

  1. Выполните шаги из раздела «Встроенный инструмент импорта».
  2. В редакторе Power Query удалите лишние столбцы, переименуйте заголовки, измените типы данных (текст на число).
  3. Нажмите Закрыть и загрузить.
  4. В следующий месяц просто замените исходный файл в папке, откройте отчет в Excel и нажмите кнопку Обновить. Данные подтянутся автоматически с примененными вами правилами очистки.

Частые ошибки и решения

При конвертации часто возникают специфические проблемы. Вот как их исправить:

ПроблемаПричинаРешение
Числа стали текстомВ исходнике были пробелы или спецсимволыВ Excel используйте «Текст по столбцам» или формулу =ЗНАЧЕН(A1)
Слиплись столбцыНечеткие границы в PDFИспользуйте разделитель в инструменте «Текст по столбцам» (обычно пробел или табуляция)
Лишние пустые строкиАртефакты версткиВ Power Query выберите «Удалить пустые строки», либо в Excel отфильтруйте и удалите вручную
Съехало форматированиеСложная структура оригиналаПосле импорта примените «Форматировать как таблицу» (Ctrl+T) для восстановления сетки

FAQ

Можно ли перенести формулы из PDF в Excel? Нет. PDF — это формат финального представления, он «запекает» результаты вычислений в статические значения или картинки. Формулы восстановить невозможно, их придется прописывать заново в Excel.

Почему при копировании (Ctrl+C / Ctrl+V) всё вставляется в одну ячейку? Буфер обмена копирует визуальное представление, а не логическую структуру таблицы. При вставке Excel не всегда понимает, где заканчивается одна ячейка и начинается другая. Всегда используйте функцию «Импорт данных» или конвертеры.

Как быть, если файл защищен паролем? Сначала снимите защиту. В Adobe Reader это делается через «Файл» → «Свойства» → «Безопасность» (нужен пароль владельца). Либо используйте онлайн-сервисы для снятия защиты перед конвертацией.

Какой способ самый быстрый? Для цифровых PDF — встроенный импорт в Excel (менее 1 минуты). Для сканов — онлайн-конвертеры с OCR (2–3 минуты с учетом загрузки).