[Python物件導向]3個必須瞭解的Python屬性觀念

文章推薦指數: 80 %
投票人數:10人

另外,也會介紹Python屬性(Property)的應用方式。

實體屬性(Instance Attribute); 類別屬性(Class Attribute); 屬性 ... 跳到主要內容 [Python物件導向]3個必須瞭解的Python屬性觀念 1月04,2020 PhotobyJeffSheldononUnsplash 本篇接續淺談Python類別(Class)文章,細談Python類別(Class)中的屬性(Attribute)觀念。

我們知道屬性(Attribute)可以分為實體屬性(InstanceAttribute)與類別屬性(ClassAttribute),今天就來探討它們的用法以及不一樣的地方。

另外,也會介紹Python屬性(Property)的應用方式。

實體屬性(InstanceAttribute) 類別屬性(ClassAttribute) 屬性(Property) 一、實體屬性(Instance Attribute) 需伴隨物件(Object)的生成來建立,也就是透過點(.)的語法或在建構式(Constructor)中所生成的屬性(Attribute)。

各物件(Object)的實體屬性(InstanceAttribute)各自獨立,修改某一個物件(Object)的實體屬性(InstanceAttribute)值時,不會影響到其他物件。

如下範例: #汽車類別 classCars: pass mazda=Cars() mazda.color="blue" mazda.seat=4 toyota=Cars() toyota.color="red" toyota.seat=6 print("mazdacolor:",mazda.color) print("mazdaseat:",mazda.seat) print("toyotacolor:",toyota.color) print("toyotaseat:",toyota.seat) 執行結果 從範例中可以看到,我們透過點(.)的方式來建立物件(Object)的屬性(Attribute),mazda和toyota物件的color與seat為實體屬性(InstanceAttribute),互相獨立且有各自的屬性值。

接下來我們來看透過建構式(Constructor)所建立的屬性(Attribute): #汽車類別 classCars: #建構式 def__init__(self,color,seat): self.color=color self.seat=seat self.weight=140 mazda=Cars("blue",4) mazda.color="yellow" mazda.seat=8 mazda.weight=200 toyota=Cars("red",6) print("mazdacolor:",mazda.color) print("mazdaseat:",mazda.seat) print("mazdaweight:",mazda.weight) print("toyotacolor:",toyota.color) print("toyotaseat:",toyota.seat) print("toyotaweight:",toyota.weight) 執行結果 在第12行~第14行我們修改了mazda物件(Object)的color、seat及weight屬性(Attribute)值,並不會影響到其他物件toyota的屬性值,所以我們可以說color、seat和weight為實體屬性(InstanceAttribute)。

二、類別屬性(ClassAttribute) 定義在類別層級的屬性(Attribute),也就是在建構式(Constructor)之外的屬性(Attribute)。

可以不需要建立物件(Object),直接透過類別名稱存取。

各物件共享類別屬性(ClassAttribute)值,也就是說當我們修改類別屬性(ClassAttribute)值時,每一個透過此類別(Class)所建立的物件(Object),都會受到影響。

如下範例: #汽車類別 classCars: door=4 #建構式 def__init__(self,color,seat): self.color=color self.seat=seat self.weight=140 mazda=Cars("blue",4) toyota=Cars("red",6) print("mazdaoriginaldoor:",mazda.door)#door原值 print("toyotaoriginaldoor:",toyota.door)#door原值 Cars.door=6 print("mazdanewdoor:",mazda.door)#door新值 print("toyotanewdoor:",toyota.door)#door新值 執行結果 我們可以看到door屬性(Attribute)定義在建構式(Constructor)之外,所以為類別屬性(ClassAttribute),並且在第18行透過類別名稱來修改其屬性值,之後所有物件(Object)如mazda及toyota物件(Object)的door屬性值皆改變了。

三、屬性(Property) 是一個允許我們設定及取得屬性(Attribute)值的物件(Object),當我們想要對類別(Class)中的屬性(Attribute)有更多的控制時,就會使用Python的屬性(Property)來達成。

先來看一個範例: #汽車類別 classCars: #建構式 def__init__(self,weight): self.weight=weight#車重屬性 mazda=Cars(-200) 我們初始化屬性(Attribute)時,傳入車重屬性值為-200,Python編譯器不會報任何錯誤,但是實際上車重不可能為負的,這時候我們要怎麼防止來源端傳入不正確的資料,而間接影響程式邏輯?有寫過其他物件導向程式語言的開發人員可能會這樣做: #汽車類別 classCars: #建構式 def__init__(self,weight): self.set_weight(weight) defget_weight(self): returnself.__weight defset_weight(self,value): ifvalue<=0: raiseValueError("Carweightcannotbe0orless.") self.__weight=value mazda=Cars(-200) 執行結果 範例於建構式(Constructor)中,呼叫設定屬性(Attribute)的方法(Method)來設定其值,並於方法(Method)中判斷如果傳入值小於等於0時,丟出例外錯誤,否則就設定weight屬性(Attribute)值。

由於我們傳入了負數,所以從執行結果可以看到ValueError的例外錯誤。

雖然此方法可以達到檢核的目的,但是這樣的寫法不"Pythonic",意思是沒有寫出Python的特點或風格,我們可以使用Python的屬性(Property)來達到相同的效果。

如下範例: #汽車類別 classCars: #建構式 def__init__(self,weight): self.weight=weight @property defweight(self): returnself.__weight @weight.setter defweight(self,value): ifvalue<=0: raiseValueError("Carweightcannotbe0orless.") self.__weight=value 在讀取屬性(Attribute)的方法(原get_weight()方法)上方加上@propertyDecorator,並且將方法名稱修改為weight,這個weight就是屬性(Property)。

接著在設定屬性(Attribute)的方法(原set_weight()方法)上方加上@property.setter,也就是@weight.setter,意思就是告訴類別(Class)當來源端要設定屬性(Property)值時,要呼叫這個方法(Method)。

同樣我們將方法名稱修改為weight,最後別忘了修改建構式(Constructor)中的屬性(Property)設定。

對來源端來說,設定或讀取的屬性(Attribute),事實上在類別(Class)中,是呼叫了屬性(Property)的設定方法(setter)及讀取方法(getter)。

我們來測試一下修改後的結果: mazda=Cars(100) print(mazda.weight) 設定mazda物件(Object)的車重屬性(Property)為100時,建構式(Constructor)呼叫加了@weight.setter的設定屬性(Property)方法(Method),而第3行在存取物件(Object)的屬性(Property)時,則是呼叫加了@property的讀取屬性(Property)方法(Method)。

另外我們傳入負數,同樣會得到ValueError的例外錯誤訊息,如下範例: mazda=Cars(-200) 執行結果 四、小結 以上就是針對Python屬性的詳細介紹,希望透過此文章,可以有更進一步的認識,在練習的過程中若有碰到任何問題或說明不清楚的地方,歡迎留言與我分享! 如果您喜歡我的文章,請幫我按五下Like(使用Google或Facebook帳號免費註冊),支持我創作教學文章,回饋由LikeCoin基金會出資,完全不會花到錢,感謝大家。

有想要看的教學內容嗎?歡迎利用以下的Google表單讓我知道,將有機會成為教學文章,分享給大家😊https://forms.gle/UW8u9XddoY17HjaSA你可能有興趣的文章 淺談Python類別(Class) 掌握重要的Python例外處理機制 五個必知的PythonFunction觀念整理 Python條件判斷 Python學習資源整理 分享 取得連結 Facebook Twitter Pinterest 以電子郵件傳送 其他應用程式 標籤 Python物件導向 標籤: Python物件導向 分享 取得連結 Facebook Twitter Pinterest 以電子郵件傳送 其他應用程式 留言 linheng2021年1月20日清晨5:27請問要怎麼區分我的類別要不要有實體方法或類別方法要怎麼區分物件需不需要實體或類別屬性....回覆刪除回覆MikeKu2021年1月26日晚上10:53您好,當您想要「每一個物件都共同擁有相同的屬性值」,就使用「類別屬性」。

相反的,如果您「不想要每一個物件都擁有相同的屬性值,而是在建立物件時,動態的進行設定」,則使用「實體屬性」。

刪除回覆回覆回覆Tim2021年3月29日下午4:36HelloMile,想請教您在property的case中的一些問題:1.請問使用property定義實體函數weight的method時,一定要使用weight當作命名而不能使用別的命名嗎例如defweight_of_car2.請問在第10行與16行我們在呼叫weight屬性時,可以不要使用self.__weight而是使用self.weight嗎?,為什麼一定要在weight前加上__?我有稍微google使用__的用途主要是變數命名具有唯一性,但我不解的是,為什麼在使用property時我們必須要使用這種方法。

謝謝您回覆刪除回覆匿名2021年4月9日下午1:56你好我不是筆者不過剛好我也有一樣的困擾所以做了些測試筆者這段提到"@property.setter,也就是@weight.setter,意思就是告訴類別(Class)當來源端要設定屬性(Property)值時,要呼叫這個方法(Method)。

"先回答你的問題1.property定義實體函數weight的method時作者命名為weight是因為建構函式裡的變數self.weight=weightself.weight<=這個變數你命名為什麼你@property和@setter方法就要命名成什麼方法裡的變數名稱則是:@propertydef你要設定的變數名稱:returnself.自己取名@你要設定的變數名稱.setterdef你要設定的變數名稱(self,你傳入的參數):self.你在propertyreturn取的變數名稱=你傳入的參數你可試試我底下的code會比較清楚我盡力了def__init__(self,name):self.aaname=name#方法(Method)@propertydefaaname(self):[email protected](self,create_name):self.realname=create_name我做測試的心得:當你在建構這個物件時(呼應筆者"當來源端要設定屬性(Property)值時"),你要建立weight的值你會去呼叫@weight.setter方法不信你可以在@weight.setter方法print(一串文字)你會發現你重建構時就會出現你print的文字了即使你沒對物件作任何其它方法的呼叫刪除回覆回覆Unknown2021年7月1日下午5:06樓上說的沒錯,但這樣也可以輸出。

#汽車類別classCars:#建構式def__init__(self,weight):self.test=weight@propertydeffuck(self):print('這裡是property')[email protected](self,value):print('我近來囉')ifvalue<=0:raiseValueError("Carweightcannotbe0orless.")self.__test2=valuemazda=Cars(1)#mazda=Cars(-200)print(mazda.fuck)然後我嘗試不加__,我發現它會一直重複輸出直到跑出'RecursionError:maximumrecursiondepthexceededwhilecallingaPythonobject'推測是不加__的話,它會重複呼叫property跟setter直到超出程式限制的遞迴限制,而我們每次只需要檢查一次,所以要加。

刪除回覆回覆回覆新增留言載入更多… 張貼留言 這個網誌中的熱門文章 [Python爬蟲教學]7個Python使用BeautifulSoup開發網頁爬蟲的實用技巧 2月28,2020 PhotobyStanleyDaionUnsplash在實務上開發專案時,很多時候會利用其他網站的資料來進行分析或運用,而取得的方式除了透過網站所提供的API(ApplicationProgrammingInterface)外,也可以利用Python來開發爬蟲程式,將網頁的HTML內容下載下來,接著利用BeautifulSoup套件(Package),擷取所需的資訊。

本文將開發一個簡單的爬蟲程式,爬取「ETtoday旅遊雲」網頁,擷取桃園旅遊景點的標題資訊,如下圖:取自ETtoday的旅遊雲而在開發的過程中,常會需要搜尋HTML的節點,本文將分享幾個常用的方法,包含:BeautifulSoup安裝以HTML標籤及屬性搜尋節點以CSS屬性搜尋節點搜尋父節點搜尋前、後節點取得屬性值取得連結文字一、BeautifulSoup安裝BeautifulSoup是一個用來解析HTML結構的Python套件(Package),將取回的網頁HTML結構,透過其提供的方法(Method),能夠輕鬆的搜尋及擷取網頁上所需的資料,因此廣泛的應用在網頁爬蟲的開發上。

Beautifulsoup套件(Package)可以透過pip指令來進行安裝,如下範例:pipinstallbeautifulsoup4而要解析網頁的HTML程式碼前,還需要安裝Python的requests套件(Package),將要爬取的網頁HTML程式碼取回來,安裝方式如下:pipinstallrequests安裝完成後,首先引用requests套件(Package),並且透過get()方法(Method)存取ETtoday旅遊雲的桃園景點網址,如下範例:importrequestsresponse=requests.get("https://travel.ettoday.net/category/%E6%A1%83%E5%9C%92/")將網頁的HTML程式碼取回來後,接著引用BeautifulSoup 分享 取得連結 Facebook Twitter Pinterest 以電子郵件傳送 其他應用程式 8則留言 閱讀完整內容 [Python物件導向]淺談Python類別(Class) 1月02,2020 PhotobyBramNausonUnsplash在學習程式語言時,或多或少都有聽過物件導向程式設計(Object-orientedprogramming,簡稱OOP),它是一個具有物件(Object)概念的開發方式,能夠提高軟體的重用性、擴充性及維護性,在開發大型的應用程式時更是被廣為使用,所以在現今多數的程式語言都有此種開發方式,Python當然也不例外。

而要使用物件導向程式設計就必須對類別(Class)及物件(Object)等有一些基本的了解,包含了:類別(Class)物件(Object)屬性(Attribute)建構式(Constructor)方法(Method)我們先來看一下今天要來建立的類別:#汽車類別classCars:#建構式def__init__(self,color,seat):self.color=color#顏色屬性self.seat=seat#座位屬性#方法(Method)defdrive(self):print(f"Mycaris{self.color}and{self.seat}seats.")接下來就針對類別(Class)各個部分來進行介紹。

一、類別(Class)簡單來說,就是物件(Object)的藍圖(blueprint)。

就像要生產一部汽車時,都會有設計圖,藉此可以知道此類汽車會有哪些特性及功能,類別(Class)就類似設計圖,會定義未來產生物件(Object)時所擁有的屬性(Attribute)及方法(Method)。

而定義類別的語法如下:classclassname:  statement首先會有class關鍵字,接著自定類別名稱,最後加上冒號。

類別名稱的命名原則習慣上使用Pascal命名法,也就是每個單字字首大寫,不得使用空白或底線分隔單字,如下範例:#範例一classCars:#範例二classMyCars:二、物件(Object)就是透過 分享 取得連結 Facebook Twitter Pinterest 以電子郵件傳送 其他應用程式 27則留言 閱讀完整內容 [Pandas教學]資料分析必懂的PandasDataFrame處理雙維度資料方法 11月01,2020 PhotobySlidebeanonUnsplash現在有許多的企業或商家,都會利用取得的使用者資料來進行分析,瞭解其中的趨勢或商機,由此可見,資料分析越來越受到重視,而這時候,能夠懂得使用資料分析工具就非常的重要。

在上一篇[Pandas教學]資料分析必懂的PandasSeries處理單維度資料方法文章中,分享了PandasSeries資料結構用於處理單維度資料集的實用方法,而本文則要來介紹Pandas套件的另一個非常重要的資料結構,也就是DataFrame。

分享 取得連結 Facebook Twitter Pinterest 以電子郵件傳送 其他應用程式 張貼留言 閱讀完整內容 [Python教學]搞懂5個Python迴圈常見用法 12月04,2019 PhotobyScottWebbonUnsplash在撰寫程式的過程中,都有機會要重複執行一些相同的運算,但是重複撰寫好幾次同樣的運算看起來非常的沒有效率,所以在這個情況下我們通常會使用迴圈來幫我們完成,本篇就來介紹Python迴圈的使用方式,包含For-Loops、NestedLoops及while-Loops,並且說明用來控制迴圈流程的break及continue指令。

一、range()方法在開始介紹Python迴圈之前,先來說明一個在執行迴圈時常用的range()方法,主要用來幫我們產生數列,語法如下:range(起始值,結束值,遞增(減)值)使用說明:range(20):起始值預設從0開始,所以會產生0到19的整數序列。

range(10,20):起始值從10開始,所以會產生10到19的整數序列。

range(10,20,3):起始值從10開始,遞增值為3,所以會產生10,13,16,19的整數序列。

二、PythonFor-Loops敘述可以針對Iterable(可疊代的)物件來進行讀取,Python內建幾個常用的Iterable物件,像是String(字串)、List(串列)、Tuples(元組)、Dictionary(字典)等,往後會出文章詳細的介紹。

Pythonfor-loop的語法如下:在語法中,in的後方就是for-loop要讀取的目標物,這個目標物的為Iterable(可疊代的)物件,一次讀取一個元素,然後用item(自訂變數名稱)來接收每次讀取到的元素,執行區塊中的運算。

注意for-loop的結尾需加上冒號(:)及區塊中的運算式要有相同的縮排,範例如下:在範例中,for-loop的讀取目標物為一個字串,每一次讀取一個字母,並且用letter變數來接收,執行print()方法。

三、PythonNestedLoops(巢狀迴圈)簡單來說,就是迴圈中又有一層迴圈,我們來看一個範例: 這個巢狀迴 分享 取得連結 Facebook Twitter Pinterest 以電子郵件傳送 其他應用程式 4則留言 閱讀完整內容 [Python+LINEBot教學]6步驟快速上手LINEBot機器人 6月28,2020 PhotobyYuraFreshonUnsplash每當朋友或家人要聚餐時,是不是總要花很長的時間尋找評價不錯的餐廳?不但要確認營業時間、消費價格及地點,還要觀看許多的美食文章才有辦法決定,這時候如果有人能夠明確提供幾間符合條件且有人氣的餐廳作為選擇,想必會省事許多。

所以筆者開發了一個美食的LINEBot小作品,透過對談的方式瞭解使用者所要尋找的餐廳條件後,利用Python網頁爬蟲取得目前正在營業的五間最高人氣餐廳資料,回覆給使用者作為參考。

為了要讓想學習的您能夠由淺入深,瞭解其中的實作過程,所以將會分成三篇文章來進行教學。

2020/06/30補充說明而在進行實作前,先來看一下LINEBot主要的執行架構,如下圖:使用者透過LINE發送訊息時,LINEPlatform將會進行接收,並且傳遞至我們所開發的LINEBot執行邏輯運算後,透過LINE所提供的MessagingAPI回應訊息給LINEPlatform,最後再將訊息傳遞給使用者。

其中MessagingAPI(ApplicationProgrammingInterface),就是LINE官方定義的回應訊息標準介面,包含Text(文字)、Sticker(貼圖)、Video(影片)、Audio(聲音)及Template(樣板)訊息等,完整的說明可以參考LINE的官方文件。

所以在我們的LINEBot回應訊息時,就要依據MessagingAPI定義的規範,傳入相應的參數後,MessagingAPI就會回應使用者相對的訊息類型。

簡單來說,就是LINEPlatform與LINEBot的溝通橋樑。

而本文就先以最基本的使用者發送什麼訊息,LINEBot就回應什麼訊息為例,讓讀者體會其中的運作方式,整體架構如下圖:在LINEBot的部分,使用Django框架來進行建置,並且透過MessagingAPI回應Text(文字)訊息。

在下一篇文章中,將會加入Python網頁爬蟲,取得美食網站的資訊回應給使用者。

本文的實作步驟包含:建立Provider建立MessagingAPIchannel設定LINEBot憑證開發LINEB 分享 取得連結 Facebook Twitter Pinterest 以電子郵件傳送 其他應用程式 46則留言 閱讀完整內容 [Python教學]5個必知的PythonFunction觀念整理 12月22,2019 PhotobySusanHoltSimpsononUnsplash在寫程式碼時有一個非常重要的觀念是DRY(Don’tRepeatYourself),意思是避免同樣的程式碼重複出現在很多個地方,除了可讀性很低外,也不易維護。

所以要適當的進行封裝,來達到程式碼的重用性(Reusable)。

今天要來教大家如何建構自己的 Python函式(Function),就是能夠讓你的程式碼被重複的使用(Reusable),並且提高維護性及可讀性。

其中有五個必須要知道的重要觀念,包含了:函式(Function)結構函式(Function)參數函式(Function)*args、**kwargs運算子函式(Function)種類函式(Function)變數範圍(Scope)一、函式(Function)結構首先Python函式的結構包含了def關鍵字、函式名稱、參數及實作內容,如下範例:函式名稱的命名習慣上會使用小寫字母,並且以底線來分隔單字。

參數用來接收外部資料,而實作的內容則是這個函式所要執行的任務,需注意縮排。

接下來就針對函式的各個部分進行詳細的說明。

二、函式(Function)參數參數簡單來說就是接收外部所傳來的資料,進而執行相關的邏輯運算。

參數個數取決於函式內部運算時所需的資料個數,所以在一般情況下,呼叫函式時一定要傳入相對的參數個數資料,否則就會出現例外錯誤,如下範例:函式的參數,又可分為:關鍵字參數(KeywordArgument):呼叫函式時,在傳入參數值的前面加上函式所定義的參數名稱,如下範例。

除了提高可讀性外,也可將此種參數打包成字典(Dictionary)資料型態,在等一下的xargs、xxargs運算子部分會來進行說明。

預設值參數(DefaultArgument):在函式定義的參數中,將可以選擇性傳入的參數設定一個預設值,當來源端有傳入該資料時,使用來源端的資料,沒有傳入時,則依照設定的預設值來進行運算,如下範例:範例中沒有傳入日期參數資料,所以函式使用預設值(2019 分享 取得連結 Facebook Twitter Pinterest 以電子郵件傳送 其他應用程式 張貼留言 閱讀完整內容 [Pandas教學]5個實用的Pandas讀取Excel檔案資料技巧 12月06,2020 PhotobyLinkedInSalesNavigatoronUnsplash日常生活中,不免俗的都會有需要整理大量資料的需求,而最常用的文書軟體就是Excel,這時候該如何有效讀取Excel檔中的資料,進行額外的整理及操作呢?本文將以政府開放資料平台-歷年國內主要觀光遊憩據點遊客人數月別統計的資料內容為例,利用Python的Pandas套件,來和大家分享實務上最常見的Excel讀取操作,藉此來提升資料處理的效率。

分享 取得連結 Facebook Twitter Pinterest 以電子郵件傳送 其他應用程式 張貼留言 閱讀完整內容 [Python教學]PythonLambdaFunction應用技巧分享 12月29,2019 PhotobyFatosBytyqionUnsplashLambda函式,也就是匿名函式,不需要定義名稱,只有一行運算式,語法非常簡潔,功能強大,所以現代程式語言如Java、C#及Python等都支援Lambda函式,適用於小型的運算,Python的一些內建函式甚至使用它作為參數值的運算。

現在就來介紹如何在Python中使用Lambda函式與技巧吧,包含:Lambda語法與範例PythonLambda函式的應用Lambda函式vs一般函式(Function)一、Lambda語法與使用範例由於Lambda函式只有一行程式碼,所以在撰寫時有一些限制,我們來看一下它的語法:lambdaparameter_list:expression這邊教大家一個技巧,在撰寫Lambda函式時,於VisualStudioCode輸入lambda關鍵字,接著按下Tab鍵,就會自動產生範例中的語法,包含了三個部分:lambda關鍵字parameter_list(參數清單)expression(運算式)其中,parameter_list(參數清單)也就是Lambda函式的傳入參數,可以有多個,以逗號分隔。

而expression(運算式)則是針對傳入參數來進行運算,只能有一行運算式,不像一般函式(Function)可以有多行。

接下來,我們透過幾個範例來了解如何使用Lambda函式吧。

範例1:範例中將Lambda函式指派給一個變數,接著就可以透過此變數並傳入參數來進行呼叫。

範例2:Lambda函式支援IIFE(immediatelyinvokedfunctionexpression)語法,意思是利用 functionexpression的方式來建立函式,並且立即執行它,語法如下:(lambdaparameter:expression)(argument)範例中即是利用此語法在Lambda函式定義後,立即傳入參數執行。

範例3:透過此範例可以知道,當Lambda函式經定義 分享 取得連結 Facebook Twitter Pinterest 以電子郵件傳送 其他應用程式 6則留言 閱讀完整內容 [Python爬蟲教學]整合PythonSelenium及BeautifulSoup實現動態網頁爬蟲 5月31,2020 PhotobyLAURENGRAYonUnsplash相信大家都知道,取得資料後能夠進行許多的應用,像是未來的趨勢預測、機器學習或資料分析等,而有效率的取得資料則是這些應用的首要議題,網頁爬蟲則是其中的一個方法。

網頁爬蟲就是能夠取得網頁原始碼中的元素資料技術,但是,有一些網頁較為特別,像是社群平台,需先登入後才能進行資料的爬取,或是電商網站,無需登入,但是要透過滾動捲軸,才會動態載入更多的資料,而要爬取這樣類型的網頁爬蟲,就稱為動態網頁爬蟲。

該如何實作呢?本文將使用PythonSelenium及BeautifulSoup套件來示範動態網頁爬蟲的開發過程,重點包含:BeautifualSoupvsSelenium安裝Selenium及Webdriver安裝BeautifulSoupSeleniumget()方法Selenium元素定位Seleniumsend_keys()方法Seleniumexecute_script方法BeautifulSoupfind_all()方法BeautifulSoupgetText()方法一、BeautifualSoupvsSeleniumBeautifulSoup套件相信對於開發網頁爬蟲的人員來說,應該都有聽過,能夠解析及取得HTML原始碼各個標籤的元素資料,擁有非常容易上手的方法(Method),但是,對於想要爬取動態網頁資料來說,則無法達成,因為BeautifulSoup套件並沒有模擬使用者操作網頁的方法(Method),像是輸入帳號密碼進行登入或滾動捲軸等,來讓網頁動態載入資料,進行爬取的動作。

所以,這時候,就可以使用被設計於自動化測試的Selenium套件,來模擬使用者的動作,進行登入後爬取資料或滾動卷軸,並且能夠執行JavaScript程式碼,這些就是Selenium與BeautifulSoup套件最大不同的地方。

對於開發Python動態爬蟲來說,就可以結合Selenium套件以上的特點,讓網頁動態載入資料後,再利用BeautifulSoup套件簡潔的方法(Method),將所需的資料爬取下來。

本文就是利用這樣的概念,利用Selenium套件登入Facebook後,前往 分享 取得連結 Facebook Twitter Pinterest 以電子郵件傳送 其他應用程式 18則留言 閱讀完整內容 [Python爬蟲教學]有效利用Python網頁爬蟲爬取免費的ProxyIP清單 10月24,2021 PhotobyCytonnPhotographyonUnsplash在開發網頁爬蟲的過程中,是不是會擔心被偵測或封鎖,而爬不到所需的資料呢?有些大型網站為了保護網頁上的資料不被大量的爬取,會特別偵測像Python網頁爬蟲這種非人工的自動化請求,這時候Python網頁爬蟲使用相同的IP來發送請求就很容易被發現。

所以,如果有多組IP能夠讓Python網頁爬蟲在發送請求時輪流使用,就能夠大幅降低被偵測的風險。

而現在有許多網站上也有提供免費的ProxyIP,本文就以FreeProxyList網站為例,透過Python網頁爬蟲來蒐集上面的ProxyIP,製作我們的IP清單。

實作步驟包含: 分享 取得連結 Facebook Twitter Pinterest 以電子郵件傳送 其他應用程式 張貼留言 閱讀完整內容 關於創辦人 MikeKu 是一位喜歡旅遊的網頁工程師,由於對Python程式語言非常有興趣,所以創辦了「LearnCodeWithMike」網站,提供線上的Python「入門教學、爬蟲應用、資料分析與網頁開發」等主題的教學,透過小專案實作的方式來幫助初學者們學習Python程式語言,並且有能力開發屬於自己的應用程式。

瀏覽簡介 取得最新發佈的免費Python教學免費訂閱 文章分類 Django套件應用3 Django教學系列16 LINEBot應用教學6 Pandas教學系列22 Pandas資料清理8 Python初學入門13 Python爬蟲教學29 Python物件導向6 Python資料結構3 Python實戰應用5 Python模組及套件2 Python學習資源1 Scrapy教學系列13 顯示更多 顯示較少 Python推薦課程 TheCompletePythonCourse Python-輕鬆學會寫程式 線上課程平台推薦 資料分析學習平台推薦



請為這篇文章評分?