Жертва Taobao

Не ходите туда… ибо обратного пути уже нет…

Как в Yahoo Pipes очищать текст RSS-ленты от ссылок?

26th Июль 2008. Рубрики: , , , . 7 коммент..

Как же легко и быстро вырезать в тексте -ленты все ссылки?
А очень просто: с помощью модуля regex и одного несложного регулярного выражения!
Заменяем «<a[^>]*>» на «пустой текст«:

модуль regex

При такой вырезке сам текст не повреждается! Ссылки из ссылок превращаются в обычный текст!
Модификатор «g» обязателен, он означает для , что замена должна проводится во всех вхождениях, если модификатор не будет включен, то в каждой записи ленты будет обработана только первая ссылка!

Подобным же образом можно вырезать не только ссылки но и любые другие тэги.

Мой блог находят по следующим фразам:

handy cash скачать бесплатно программа сжатия интернет трафика на русском бесплатно
globax сжатие трафика скачать бесплатно
Лучшая программа телевидения
tunnel сжимать трафик
сжиматели трафика
yahoo pipes regex

7 коммент.

Peter  | 29th Июль 2008

раз уж у нас с вами завязалось конструктивное общение.. следующий вопрос и тема которая думаю будет интересна многим читателям))
как сделать фид с полными текстами понятно. в общем то несложная задача как оказалось..)).. мелкие посты тоже фильтровать умеем — оставляем только полновесные статьи..)
идем дальше по пути «очеловечивания» нашего фида)).. а именно — хорошо было бы в начале каждой полной статьи иметь небольшую картинку..))
в пайпс есть модуль который парсит картинки с фликера. и в общем то неплохо справляется с этой задачей.. собственно вопрос — как нам картинки которые напарсились теперь вставить в посты??.. пробывал модуль Юнион.. но он делает совсем не то..
заранее благодарен за ответ..

Peter  | 31st Июль 2008

в другом блоге наткнулся на идею как это можно сделать.. осталось только реализовать..)

Р_Джинс  | 1st Август 2008

ну как как…. берем Loop .. помещаем в него Flickr … пропускаем через Loop наш фид — получаем в нем item.loop:flickr … дальше Regex`ом объединяем помещаем содержимое item.loop:flickr вначало item.description вот и всё…
Вот пример такой трубы — http://delirium.vrjj.ru/out/aHR0cDovL3BpcGVzLnlhaG9vLmNvbS92cmpqL2ZsaWNrcl9wcmltZXI=/

Тормоз  | 2nd Август 2008

Неплохо бы ещё закрывающие тэги удалять тоже. Или они автоматически валидируются пайпсами? Не помню уже.

Р_Джинс  | 2nd Август 2008

Тормоз,
да! забыл заострить на этом внимание: как показали опыты достаточно затереть лишь открывающие тэги а закрывающие уже после этого вычищаются пайпсами автоматически…

Тормоз  | 2nd Август 2008

А, ну классно :) Вот какие пайпсы умнички. Ещё бы nofollow в ссылки не ставили…

xron  | 12th Август 2008

Спасибо за советы. Пишите еще. Было бы интересно почитать про перевод статей с помощью google translate, а то встроеный модуль весьма «косячный».
Еще раз спасибо.

Оставить комментарий или два.