Impor data tina PDF ka Excel via Power Query

Tugas nransferkeun data tina spreadsheet dina file PDF ka lambaran Microsoft Excel sok "senang". Utamana upami anjeun henteu gaduh parangkat lunak pangenalan anu mahal sapertos FineReader atanapi anu sapertos kitu. Niron langsung biasana henteu ngakibatkeun nanaon alus, sabab. saatos nempelkeun data anu disalin kana lambaranana, aranjeunna paling dipikaresep bakal "ngahiji" kana hiji kolom. Janten aranjeunna kedah teras-terasan dipisahkeun nganggo alat Téks ku kolom ti tab data (Data - Téks kana Kolom).

Sareng tangtosna, nyalin ngan ukur tiasa waé pikeun file PDF anu aya lapisan téks, nyaéta kalayan dokumén anu nembé diseken tina kertas ka PDF, ieu henteu tiasa dianggo sacara prinsip.

Tapi teu jadi hanjelu, nyaan 🙂

Upami anjeun gaduh Office 2013 atanapi 2016, maka dina sababaraha menit, tanpa program tambahan, cukup mungkin pikeun mindahkeun data tina PDF ka Microsoft Excel. Sareng Word sareng Power Query bakal ngabantosan urang dina ieu.

Salaku conto, hayu urang nyandak laporan PDF ieu sareng sakumpulan téks, rumus sareng tabel tina situs wéb Komisi Ékonomi Éropa:

Impor data tina PDF ka Excel via Power Query

sareng cobian tarik kaluar tina éta dina Excel, ucapkeun tabel anu munggaran:

Impor data tina PDF ka Excel via Power Query

Hayu angkat!

Lengkah 1. Buka PDF dina Word

Kanggo sababaraha alesan, sababaraha urang terang, tapi saprak 2013 Microsoft Word parantos diajar muka sareng ngakuan file PDF (sanaos anu diseken, nyaéta, tanpa lapisan téks!). Hal ieu dilakukeun dina cara lengkep standar: buka Word, klik File - Buka (Koropak - Buka) jeung nangtukeun format PDF dina daptar turun-handap di pojok katuhu handap jandela.

Teras pilih file PDF anu urang peryogikeun teras klik kabuka (Muka). Word nyarioskeun ka urang yén éta bakal ngajalankeun OCR dina dokumén ieu kana téks:

Impor data tina PDF ka Excel via Power Query

Kami satuju sareng dina sababaraha detik urang bakal ningali PDF kami dibuka pikeun ngédit anu parantos aya dina Word:

Impor data tina PDF ka Excel via Power Query

Tangtosna, desain, gaya, fon, header sareng footer, jsb sawaréh bakal ngapung tina dokumen éta, tapi ieu henteu penting pikeun urang - urang ngan ukur peryogi data tina tabel. Sacara prinsip, dina tahap ieu, éta geus pikabitaeun mun saukur nyalin tabel tina dokumen dipikawanoh kana Word tur saukur nempelkeun kana Excel. Kadang-kadang gawéna, tapi leuwih mindeng ngabalukarkeun sagala sorts distortions data - contona, angka bisa robah jadi kaping atawa tetep téks, sakumaha dina kasus urang, sabab. PDF ngagunakeun non-separator:

Impor data tina PDF ka Excel via Power Query

Janten hayu urang henteu motong sudut, tapi ngajantenkeun sadayana langkung rumit, tapi leres.

Lengkah 2: Simpen Dokumén salaku Halaman Wéb

Pikeun teras ngamuat data anu ditampi kana Excel (via Power Query), dokumén kami dina Word kedah disimpen dina format halaman wéb - format ieu, dina hal ieu, mangrupikeun jinis pangbagi umum antara Word sareng Excel.

Jang ngalampahkeun ieu, buka menu nu File - Simpen Salaku (Koropak - Simpen Salaku) atawa pencét kenop F12 dina kibor sareng dina jandela anu muka, pilih jinis file Halaman wéb dina hiji file (Kaca wéb - file tunggal):

Impor data tina PDF ka Excel via Power Query

Saatos nyimpen, anjeun kedah kéngingkeun file nganggo ekstensi mhtml (upami anjeun ningali ekstensi file dina Explorer).

Tahap 3. Unggah file ka Excel via Power Query

Anjeun tiasa muka file MHTML anu didamel dina Excel langsung, tapi teras urang bakal nampi, mimitina, sadaya eusi PDF sakaligus, sareng téks sareng sakumpulan tabel anu teu perlu, sareng, kadua, urang bakal leungit deui data kusabab salah. separators. Ku kituna, urang bakal ngalakukeun impor kana Excel ngaliwatan Power Query add-in. Ieu mangrupikeun tambihan gratis anu anjeun tiasa unggah data ka Excel tina ampir sadaya sumber (file, polder, pangkalan data, sistem ERP) teras ngarobih data anu ditampi dina sagala cara anu mungkin, masihan bentuk anu dipikahoyong.

Upami anjeun gaduh Excel 2010-2013, teras anjeun tiasa ngaunduh Power Query tina situs wéb Microsoft resmi - saatos instalasi anjeun bakal ningali tab. Patarosan Kakuatan. Upami anjeun gaduh Excel 2016 atanapi langkung énggal, maka anjeun henteu kedah ngaunduh nanaon - sadaya pungsionalitasna parantos diwangun kana Excel sacara standar sareng ayana dina tab. data (Kaping) dina grup Ngundeur tur Convert (Kéngingkeun & Transformasi).

Ku kituna urang buka boh ka tab data, atawa dina tab Patarosan Kakuatan jeung milih tim Pikeun meunangkeun data or Jieun Query - Tina File - Tina XML. Pikeun ngajantenkeun file XML sanés ngan ukur katingali, robih saringan dina daptar turun-handap di pojok katuhu handap jandela ka Sadaya file (Sadaya file) sareng tangtukeun file MHTML kami:

Impor data tina PDF ka Excel via Power Query

Punten dicatet yén impor moal suksés, sabab. Power Query ngarepkeun XML ti kami, tapi kami leres-leres gaduh format HTML. Ku alatan éta, dina jandela saterusna nu nembongan, Anjeun kudu klik katuhu dina file teu kaharti ku Power Query jeung nangtukeun format na:

Impor data tina PDF ka Excel via Power Query

Saatos éta, filena bakal dikenal leres sareng urang bakal ningali daptar sadaya tabel anu dikandungna:

Impor data tina PDF ka Excel via Power Query

Anjeun tiasa ningali eusi tabel ku ngaklik tombol beurit kénca dina latar bodas (henteu dina kecap Table!) Dina sél dina kolom Data.

Nalika tabel nu dipikahoyong dihartikeun, klik dina kecap héjo meja - sareng anjeun "gugur" kana eusina:

Impor data tina PDF ka Excel via Power Query

Tetep ngalakukeun sababaraha léngkah saderhana pikeun "nyisiran" eusina, nyaéta:

  1. Hapus kolom anu teu perlu (klik katuhu dina lulugu kolom - mindahkeun)
  2. ngaganti titik-titik ku koma (pilih kolom, klik katuhu - Ngaganti nilai)
  3. hapus tanda anu sami dina header (pilih kolom, klik katuhu - Ngaganti nilai)
  4. cabut garis luhur (imah – Pupus garis – Pupus garis luhur)
  5. miceun garis kosong (Imah - Hapus garis - Hapus garis kosong)
  6. naékkeun baris kahiji kana lulugu méja (Imah - Paké baris kahiji salaku lulugu)
  7. nyaring data nu teu perlu maké saringan

Nalika tabél dibawa ka bentuk normal, éta tiasa dibongkar dina lambaran kalayan paréntah nutup tur ngundeur (Tutup & Muat) on utama tab. Sareng urang bakal kéngingkeun kaéndahan sapertos anu urang parantos tiasa damel:

Impor data tina PDF ka Excel via Power Query

  • Ngarobah Kolom jadi Méja kalawan Power Query
  • Ngabagi téks caket kana kolom

Leave a Reply