LeGoLaS
Onursal Üye
- Üyelik Tarihi
- 1 Ağu 2008
- Konular
- 4,885
- Mesajlar
- 16,461
- MFC Puanı
- 15,790
pyquery Html parçalamanızı sağlayan bir modül. Bu modülün en muhteşem yanı ise bu parçalama işlemini yaparken Jquery seçicilerini ve fonksiyonlarını kullanıyor olmanız. Eğer az bir şey Jquery biliyorsanız bu modülü kullanarak bir İnternet sayfasının kaynağından istediğiniz kısımı çok kolay bir şekilde alabilirsiniz.
Kurulum
Kurmak için şu komutu verin
[/COLOR]
Kurulum tamam olduğuna göre kullanabiliriz. Bağlandığımız sitenin başlığını alalım.
[/COLOR]
Gördüğünüz gibi k nesnesi üzerinde Jquery özelliklerini kullanabiliyoruz. Özellik silebiliriz.
[/COLOR]
class özelliğini sildik. Öğe içerisinden nesne seçebilir, nesne arayabilir, bulduğumuz nesnenin içeriğini değiştirebiliriz. Hepsini birden yapalım.
[/COLOR]
Örneğin bağlandığımız sitenin menu kısmındaki bağlantıların linklerini alalım.
[/COLOR]
Son olarak bağlandığımız sayfadaki yazıların başlıklarını alalım.
[/COLOR]
Gördüğünüz gibi birazcık JQuery bilginiz varsa bu modül sayesinde HTML parse(parçalamak) gerçekten de çok kolay.
Daha fazla bilgiye kendi dökümantasyonundan ulaşabilirsiniz.
https://pythonhosted.org/pyquery/api.html
Kurulum
Kurmak için şu komutu verin
[COLOR=white !important]?
1
sudo pip install pyquery;
[/COLOR]
Kurulum tamam olduğuna göre kullanabiliriz. Bağlandığımız sitenin başlığını alalım.
[COLOR=white !important]?
1
2
3
4
5
6
7
2
3
4
5
6
7
from pyquery import PyQuery
k = PyQuery("http://mazlumagar.com")
print k('title').html()
#Çıktı;
Mazlum Ağar
k = PyQuery("http://mazlumagar.com")
print k('title').html()
#Çıktı;
Mazlum Ağar
[/COLOR]
Gördüğünüz gibi k nesnesi üzerinde Jquery özelliklerini kullanabiliyoruz. Özellik silebiliriz.
[COLOR=white !important]?
1
2
3
4
5
2
3
4
5
k = PyQuery('<div class="sinif"><a href="">Baglanti</a></div>')
k.remove_attr('class')
print k
#Çıktı;
<div><a href="">Baglanti</a></div>
k.remove_attr('class')
print k
#Çıktı;
<div><a href="">Baglanti</a></div>
[/COLOR]
class özelliğini sildik. Öğe içerisinden nesne seçebilir, nesne arayabilir, bulduğumuz nesnenin içeriğini değiştirebiliriz. Hepsini birden yapalım.
[COLOR=white !important]?
1
2
3
4
5
2
3
4
5
from pyquery import PyQuery
k = PyQuery("http://mazlumagar.com")
print k('.commentcount').eq(0).find("a").append(" Link icerigi degistirildi")
#Çıktı;
<a href="http://www.mazlumagar.com/linuxa-postgresql-kurulum/#comments" class="comment-link" title="Linux’a PostgreSQL Kurulum için yapılan yorumlar"><span class="icon comments"/> 1 Yorum Link icerigi degistirildi</a>
k = PyQuery("http://mazlumagar.com")
print k('.commentcount').eq(0).find("a").append(" Link icerigi degistirildi")
#Çıktı;
<a href="http://www.mazlumagar.com/linuxa-postgresql-kurulum/#comments" class="comment-link" title="Linux’a PostgreSQL Kurulum için yapılan yorumlar"><span class="icon comments"/> 1 Yorum Link icerigi degistirildi</a>
[/COLOR]
Örneğin bağlandığımız sitenin menu kısmındaki bağlantıların linklerini alalım.
[COLOR=white !important]?
1
2
3
4
5
2
3
4
5
for i in k(".menu").find("ul").find("li").items("a"):
print i.attr("href")
#Çıktı
http://www.mazlumagar.com/hakkimda/
http://www.mazlumagar.com/iletisim/
print i.attr("href")
#Çıktı
http://www.mazlumagar.com/hakkimda/
http://www.mazlumagar.com/iletisim/
[/COLOR]
Son olarak bağlandığımız sayfadaki yazıların başlıklarını alalım.
[COLOR=white !important]?
1
2
3
4
5
6
7
8
9
10
11
12
13
2
3
4
5
6
7
8
9
10
11
12
13
for a in k('.postcontent').find("h2").items("a"):
print a.html()
#Çıktı;
Linux’a PostgreSQL Kurulum
Ubuntu Üzerine VMware Workstation Kurulumu
Linux Komutları 3 – Dosya İşlemleri
Linux Komutları 2 – Dizin İşlemleri
Linux Komutları 1
CKeditor Resim Upload İşlemi
Ubuntu TeamViewer Kurulumu
Elementary Os
Linux Guake Terminal
Ubuntu’da htaccess Dosyası Oluşturma
print a.html()
#Çıktı;
Linux’a PostgreSQL Kurulum
Ubuntu Üzerine VMware Workstation Kurulumu
Linux Komutları 3 – Dosya İşlemleri
Linux Komutları 2 – Dizin İşlemleri
Linux Komutları 1
CKeditor Resim Upload İşlemi
Ubuntu TeamViewer Kurulumu
Elementary Os
Linux Guake Terminal
Ubuntu’da htaccess Dosyası Oluşturma
[/COLOR]
Gördüğünüz gibi birazcık JQuery bilginiz varsa bu modül sayesinde HTML parse(parçalamak) gerçekten de çok kolay.
Daha fazla bilgiye kendi dökümantasyonundan ulaşabilirsiniz.
https://pythonhosted.org/pyquery/api.html