Лучшая учеба — решение практических задач — подумал я и начал писать парсер электронных адресов. Больше подробностей об этом тут, а сейчас — о доработанной версии, которая к настоящему моменту не доработана (сюрприз!), но уже что-то там собирает 🙂
Столкнулся с проблемой уборки лишних символов в списке (да, можно парсить построчно через регулярное выражение, но я пошел путем проверки файла целиком, после чего полученная строка с набором адресов разбивается на части. Оказывается, replace обрабатывает только одну пару старое-новое значение, а что делать, если таких значений несколько? Все просто: ставим все это через точку 🙂
mailaddress = i.replace(‘[‘, »).replace(‘]’, »).replace(‘»‘, »).replace(‘,’, »).replace(‘\», »)
, где:
i — некоторая строка
replace(‘[‘, ») — убираем открывающую квадратную скобку
replace(‘]’, ») — убираем закрывающую квадратную скобку
replace(‘»‘, ») — убираем двойную кавычку
replace(‘,’, ») — убираем запятую
replace(‘\», ») — убираем одинарную кавычку
Спасибо за внимание! И да, если у вас есть желание поделиться более работающей конструкцией — прошу написать на почту.