Menghapus Path Website Menggunakan Python
1. Install Module
pip install urllib3
Kalian bisa install melalui terminal kalian, dan pastikan ada jaringan internet buat install modulnya.
2. Import Module
from urllib.parse import urlparse
Buat file python kalian dengan format .py dan line pertama kalian isi code di atas.
3. Menulis Code Parse URL
url = "https://www.malastech.my.id/my/id/dot/main.html?url=wannaz.my.id#profil"
parse_url = urlparse(url)
netloc = parse_url.netloc
Disini variabel url bisa diisi dengan url atau link web yang mau di bersihkan pathnya, selanjutnya di variabel parse_url adalah menparse url yang kita masukan. Netloc bisa di sederhanakan sebagai domain utama kita.
4. Print Output
print(netloc)
Maka outputnya adalah menjadi hanya domain saja dan parameter, dir, query, fragment akan hilang.
Kesimpulan
Jadi module urllib ini mempunyai class urlparse yang berfungsi untuk menparse url yang terlalu panjang atau mau mengambil bagian tertentu saja, kalian bisa buat ini menjadi versi mass maupun single, untuk lebih mengenal bisa cek di link ini.
Docs : Dokumentasi Urlparse Urllib
Sekian dulu untuk artikel simpel dan semoga bermanfaat bagi temen-temen, maaf sudah jarang aktif blog karena faktor mood hehe, bisa di share ke teman-teman atau media sosial juga ya, See You Next Artikel.
wah makasih ilmunya om
BalasHapusSiap om
Hapus