python code: extract pdf metadata-526互联

file name is extract_pdf_metadata.py

import PyPDF2
import sys

def extract_academic_metadata(pdf_file):
    try:
        pdf = PyPDF2.PdfReader(open(pdf_file, 'rb'))
        metadata = pdf.metadata
        # for key, value in metadata.items():
        #    print(f'{key}: {value}')
            
        publisher_name = metadata.get('/Subject', 'N/A')
        # You can add more custom metadata fields as needed
        print(f'Journal: {publisher_name}')
    except Exception as e:
        print(f'Error: {e}')

if __name__ == "__main__":
    if len(sys.argv) != 2:
        print("Usage: python extract_metadata.py <pdf_file>")
    else:
        pdf_file = sys.argv[1]
        extract_academic_metadata(pdf_file)

metadata

extract

python

code

pdf

metadata extract python code

extracting tables python from

python图片pdf

python word pdf

python pdf-for-python spire pdf

pdf-for-python

code-c invoke python code

公众python文章pdf

项目python问题code

文件python pdf