БЕСПЛАТНО СКАЧАТЬ КНИГИ по Python на русском языке можно у нас в телеграм канале "Python книги на русском"
Одним из маленьких раздражителей в программировании является то, что путь к файлу в Microsoft Windows строится с использованием символа обратной косой черты между именами папок, в то время как почти все другие ОС используют прямую:
Путь к файлу в Windows: C:\some_folder\some_file.txt В большинстве других ОС: /some_folder/some_file.txt
Это случайность компьютерной истории начала 1980-х годов. В первой версии MS-DOS для указания параметров командной строки использовался символ прямой косой черты. Когда Microsoft добавила поддержку папок в MS-DOS 2.0, символ прямой косой черты был уже занят, поэтому вместо него использовалась обратная косая черта. Тридцать пять лет спустя мы по-прежнему сталкиваемся с этой несовместимостью.
Если вы хотите, чтобы ваш код на Python работал как на Windows, так и на Mac/Linux, вам придется решать подобные проблемы, связанные с конкретной платформой. К счастью, в Python 3 есть новый модуль pathlib
, который делает работу с файлами практически безболезненной.
Давайте рассмотрим различные способы обработки путей к именам файлов и узнаем, как pathlib
может сделать вашу жизнь лучше!
Неправильное решение: построить путь к файлу вручную
Допустим, у вас есть папка, содержащая файл, который вы хотите открыть в вашей программе Python:
Сделать так будет неправильно:
data_folder = "source_data/text_files/" file_to_open = data_folder + "raw_data.txt" f = open(file_to_open) print(f.read())
Обратите внимание, что я жестко закодировал путь к файлу, используя прямые слэши в стиле Unix, поскольку я работаю на Mac. Это разозлит пользователей Windows.
Технически этот код будет работать под Windows, потому что в Python есть хак, который распознает любой вид слэша, когда вы вызываете open()
под Windows. Но полагаться на это не стоит. Если вы используете тип слэша, не подходящий для ОС, не все библиотеки Python будут работать, особенно если они взаимодействуют с внешними программами или библиотеками.
А поддержка Python для смешивания типов слэшей – это хак только для Windows, который не работает в обратном направлении. Использование обратных слешей в коде будет полностью провальным на Mac:
data_folder = "source_data\\text_files\\" file_to_open = data_folder + "raw_data.txt" f = open(file_to_open) print(f.read()) # На Mac этот код выбросит исключение: # FileNotFoundError: [Errno 2] No such file or directory: 'source_data\\text_files\\raw_data.txt'
По этим и другим причинам написание кода с жестко закодированными строками путей – это то, что заставит других программистов смотреть на вас с большим подозрением. В общем, нужно стараться избегать этого.
Старое решение: построить путь к файлу при помощи модуля os.path
Модуль os.path
в Python имеет множество инструментов для решения ОС-специфичных проблем с файловой системой.
Вы можете использовать os.path.join()
для построения строки пути, используя нужный вид слэша для текущей операционной системы:
import os.path data_folder = os.path.join("source_data", "text_files") file_to_open = os.path.join(data_folder, "raw_data.txt") f = open(file_to_open) print(f.read())
Этот код будет отлично работать как на Windows, так и на Mac. Проблема в том, что его сложно использовать. Выписывать os.path.join()
и передавать каждую часть пути в виде отдельной строки – многословно и неинтуитивно.
Поскольку большинство функций в модуле os.path
так же неудобны в использовании, разработчики часто “забывают” их использовать. Это приводит к множеству кроссплатформенных ошибок и недовольству пользователей.
Лучшее решение: использовать pathlib в Python 3
В Python 3.4 появилась новая стандартная библиотека с модулем pathlib
для работы с файлами и путями – и это замечательно!
Теперь вам достаточно передать путь к файлу или его имя в новый объект Path()
, используя прямые косые черты, а все остальное pathlib
сделает сам:
from pathlib import Path data_folder = Path("source_data/text_files/") file_to_open = data_folder / "raw_data.txt" f = open(file_to_open) print(f.read())
Обратите внимание на два момента:
- С функциями pathlib нужно использовать прямые слэши. Объект
Path()
преобразует их в правильный вид слэша для текущей операционной системы. Отлично! - Если вы хотите дополнить путь к файлу, можно использовать оператор
/
непосредственно в коде. Попрощайтесь с беспрестанным наборомos.path.join(a, b)
.
И даже если бы это было всё, на что способен pathlib
, это уже было бы отличным дополнением к Python. Но этот модуль способен на большее!
Например, мы можем прочитать содержимое текстового файла, не возясь с его открытием и закрытием:
from pathlib import Path data_folder = Path("source_data/text_files/") file_to_open = data_folder / "raw_data.txt" print(file_to_open.read_text())
Фактически, pathlib
делает большинство стандартных операций с файлами быстрыми и простыми:
from pathlib import Path filename = Path("source_data/text_files/raw_data.txt") print(filename.name) # Выводит "raw_data.txt" print(filename.suffix) # Выводит "txt" print(filename.stem) # Выводит "raw_data" if not filename.exists(): print("Oops, file doesn't exist!") else: print("Yay, the file exists!")
Вы даже можете использовать pathlib
для явного преобразования пути Unix в путь в формате Windows:
from pathlib import Path, PureWindowsPath filename = Path("source_data/text_files/raw_data.txt") # Конвертировать путь в формат Windows path_on_windows = PureWindowsPath(filename) print(path_on_windows) # Вывод: # source_data\text_files\raw_data.txt
И если вы хотите действительно безопасно использовать обратные слеши в своем коде, вы можете объявить свой путь к файлу в формате Windows, и pathlib
преобразует его для работы в текущей операционной системе:
from pathlib import Path, PureWindowsPath # Я явно объявил мой путь в формате Windows, чтобы использовать в нем прямые слэши. filename = PureWindowsPath("source_data\\text_files\\raw_data.txt") # Конвертировать путь в подходящий для текущей ОС формат correct_path = Path(filename) print(correct_path) # Выводит "source_data/text_files/raw_data.txt" на Mac и Linux # Выводит "source_data\text_files\raw_data.txt" на Windows
Проявив смекалку, можно использовать pathlib
даже для разрешения относительных путей к файлам, разбора путей к сетевым ресурсам и генерации URL file://. Вот пример из всего пары строк кода, которые откроют локальный файл в вашем браузере:
from pathlib import Path import webbrowser filename = Path("source_data/text_files/raw_data.txt") webbrowser.open(filename.absolute().as_uri())
Это был лишь небольшой обзор pathlib
. Этот модуль – отличная замена для множества различных функций, связанных с файлами, которые раньше были разбросаны по разным модулям Python. Проверьте!
Спасибо за чтение!
Перевод статьи Adam Geitgey «Python 3 Quick Tip: The easy way to deal with file paths on Windows, Mac and Linux».
Пингбэк: Поиск текста в нескольких файлах на Python - pythonturbo
Пингбэк: Руководство по использованию pathlib в Python