Neler yeni
Türkiye'nin En Güncel Forum Sitesi

Forum içeriğine ve tüm hizmetlerimize erişim sağlamak için foruma kayıt olmalı yada giriş yapmalısınız. Forum üye olmak tamamen ücretsizdir.

PYTHON - PYQUERY MODÜLÜ

LeGoLaS

ikra
Emektar Yönetici
Konum
Türkiye
  • Üyelik Tarihi
    1 Ağu 2008
  • Mesajlar
    9,931
  • MFC Puanı
    1,646
  • MFC Seviyesi

pyquery Html parçalamanızı sağlayan bir modül. Bu modülün en muhteşem yanı ise bu parçalama işlemini yaparken Jquery seçicilerini ve fonksiyonlarını kullanıyor olmanız. Eğer az bir şey Jquery biliyorsanız bu modülü kullanarak bir İnternet sayfasının kaynağından istediğiniz kısımı çok kolay bir şekilde alabilirsiniz.





Kurulum
Kurmak için şu komutu verin
[COLOR=white !important]?
1
sudo pip install pyquery;

[/COLOR]
Kurulum tamam olduğuna göre kullanabiliriz. Bağlandığımız sitenin başlığını alalım.
[COLOR=white !important]?
1
2
3
4
5
6
7
from pyquery import PyQuery

k = PyQuery("http://mazlumagar.com")

print k('title').html()
#Çıktı;
Mazlum Ağar

[/COLOR]
Gördüğünüz gibi k nesnesi üzerinde Jquery özelliklerini kullanabiliyoruz. Özellik silebiliriz.
[COLOR=white !important]?
1
2
3
4
5
k = PyQuery('<div class="sinif"><a href="">Baglanti</a></div>')
k.remove_attr('class')
print k
#Çıktı;
<div><a href="">Baglanti</a></div>

[/COLOR]
class özelliğini sildik. Öğe içerisinden nesne seçebilir, nesne arayabilir, bulduğumuz nesnenin içeriğini değiştirebiliriz. Hepsini birden yapalım.
[COLOR=white !important]?
1
2
3
4
5
from pyquery import PyQuery
k = PyQuery("http://mazlumagar.com")
print k('.commentcount').eq(0).find("a").append(" Link icerigi degistirildi")
#Çıktı;
<a href="http://www.mazlumagar.com/linuxa-postgresql-kurulum/#comments" class="comment-link" title="Linux’a PostgreSQL Kurulum için yapılan yorumlar"><span class="icon comments"/> 1 Yorum Link icerigi degistirildi</a>

[/COLOR]
Örneğin bağlandığımız sitenin menu kısmındaki bağlantıların linklerini alalım.
[COLOR=white !important]?
1
2
3
4
5
for i in k(".menu").find("ul").find("li").items("a"):
print i.attr("href")
#Çıktı
http://www.mazlumagar.com/hakkimda/
http://www.mazlumagar.com/iletisim/

[/COLOR]
Son olarak bağlandığımız sayfadaki yazıların başlıklarını alalım.
[COLOR=white !important]?
1
2
3
4
5
6
7
8
9
10
11
12
13
for a in k('.postcontent').find("h2").items("a"):
print a.html()
#Çıktı;
Linux’a PostgreSQL Kurulum
Ubuntu Üzerine VMware Workstation Kurulumu
Linux Komutları 3 – Dosya İşlemleri
Linux Komutları 2 – Dizin İşlemleri
Linux Komutları 1
CKeditor Resim Upload İşlemi
Ubuntu TeamViewer Kurulumu
Elementary Os
Linux Guake Terminal
Ubuntu’da htaccess Dosyası Oluşturma

[/COLOR]
Gördüğünüz gibi birazcık JQuery bilginiz varsa bu modül sayesinde HTML parse(parçalamak) gerçekten de çok kolay.
Daha fazla bilgiye kendi dökümantasyonundan ulaşabilirsiniz.
https://pythonhosted.org/pyquery/api.html
 
Üst Alt