diff --git a/content_processor.py b/content_processor.py index 09f781c..38f2e6e 100644 --- a/content_processor.py +++ b/content_processor.py @@ -131,10 +131,16 @@ class ContentProcessor: def extract_links(self, text): self.logger.debug("Извлекаем ссылки из текста") - url_pattern = re.compile(r'https?://\S+') + # Улучшенное регулярное выражение, исключающее конечные знаки препинания + url_pattern = re.compile(r'https?://[^\s\)\]\}\>,;]+') links = url_pattern.findall(text) - self.logger.debug(f"Найденные ссылки: {links}") - return links + # Дополнительная очистка: убираем точки и запятые в конце + cleaned_links = [] + for link in links: + link = link.rstrip('.,!?') + cleaned_links.append(link) + self.logger.debug(f"Найденные ссылки: {cleaned_links}") + return cleaned_links def format_for_vk(self, content): """Форматирование контента для VK"""