當前位置:吉日网官网 - 紀念幣收藏 - xposed + python 怎麽爬取微信朋友圈的數據

xposed + python 怎麽爬取微信朋友圈的數據

有JAVA的,妳參考壹下

主要思路

從UI獲取文本信息是最為簡單的方法,於是應該優先逆向UI代碼部分。

逆向微信apk

首先解包微信apk,用dex2jar反編譯classes.dex,然後用JD-GUI查看jar源碼。當然,能看到的源碼都是經過高度混淆的。但是,繼承自安卓重要組件(如Activity、Service等)的類名無法被混淆,於是還是能從中看到點東西。

首先定位到微信APP package。我們知道這個是 com.tencent.mm

在 com.tencent.mm

中,我們找到壹個 ui

包,有點意思。

展開 com.tencent.mm.ui

,發現多個未被混淆的類,其中發現 MMBaseActivity

直接繼承自 Activity

, MMFragmentActivity

繼承自 ActionBarActivity

, MMActivity

繼承自 MMFragmentActivity

,並且 MMActivity

是微信中大多數Activity的父類:

public class MMFragmentActivity

extends ActionBarActivity

implements SwipeBackLayout.a, b.a {

...

}

public abstract class MMActivity

extends MMFragmentActivity {

...

}

public class MMBaseActivity

extends Activity {

...

}

現在需要找出朋友圈的Activity,為此要用Xposed hook MMActivity

創建壹個Xposed模塊

參考 [TUTORIAL]Xposed module devlopment

,創建壹個Xposed項目。

簡單Xposed模塊的基本思想是:hook某個APP中的某個方法,從而達到讀寫數據的目的。

小編嘗試hook com.tencent.mm.ui.MMActivity.setContentView

這個方法,並打印出這個Activity下的全部TextView內容。那麽首先需要遍歷這個Activity下的所有TextView,遍歷ViewGroup的方法參考了SO的以下代碼:

private void getAllTextViews(final View v) {

if (v instanceof ViewGroup) {

ViewGroup vg = (ViewGroup) v;

for (int i = 0; i < vg.getChildCount(); i++) {

View child = vg.getChildAt(i);

getAllTextViews(child);

}

} else if (v instanceof TextView ) {

dealWithTextView((TextView)v); //dealWithTextView(TextView tv)方法:打印TextView中的顯示文本

}

}

Hook MMActivity.setContentView

的關鍵代碼如下:

findAndHookMethod("com.tencent.mm.ui.MMActivity", lpparam.classLoader, "setContentView", View.class, new XC_MethodHook() {

...

});

在findAndHookMethod方法中,第壹個參數為完整類名,第三個參數為需要hook的方法名,其後若幹個參數分別對應該方法的各形參類型。在這裏, Activity.setContentView(View view)

方法只有壹個類型為 View

的形參,因此傳入壹個 View.class

現在,期望的結果是運行時可以從Log中讀取到每個Activity中的所有的TextView的顯示內容。

但是,因為View中的數據並不壹定在 setContentView()

時就加載完畢,因此小編的實驗結果是,log中啥都沒有。

意外的收獲

當切換到朋友圈頁面時,Xposed模塊報了壹個異常,異常源從 com.tencent.mm.plugin.sns.ui.SnsTimeLineUI

這個類捕捉到。從類名上看,這個很有可能是朋友圈首頁的UI類。展開這個類,發現更多有趣的東西:

這個類下有個子類 a

(被混淆過的類名),該子類下有個名為 gyO

的 ListView

類的實例。我們知道, ListView

是顯示列表類的UI組件,有可能就是用來展示朋友圈的列表。

順藤摸瓜

那麽,我們先要獲得壹個 SnsTimeLineUI.a.gyO

的實例。但是在這之前,要先獲得壹個 com.tencent.mm.plugin.sns.ui.SnsTimeLineUI.a

的實例。繼續搜索,發現 com.tencent.mm.plugin.sns.ui.SnsTimeLineUI

有壹個名為 gLZ

的 SnsTimeLineUI.a

實例,那麽我們先取得這個實例。

經過測試, com.tencent.mm.plugin.sns.ui.SnsTimeLineUI.a(boolean, boolean, String, boolean)

這個方法在每次初始化微信界面的時候都會被調用。因此我們將hook這個方法,並從中取得 gLZ

findAndHookMethod("com.tencent.mm.plugin.sns.ui.SnsTimeLineUI", lpparam.classLoader, "a", boolean.class, boolean.class, String.class, boolean.class, new XC_MethodHook() {

@Override

protected void afterHookedMethod(MethodHookParam param) throws Throwable {

XposedBridge.log("Hooked. ");

Object currentObject = param.thisObject;

for (Field field : currentObject.getClass().getDeclaredFields()) { //遍歷類成員

field.setAccessible(true);

Object value = field.get(currentObject);

if (field.getName().equals("gLZ")) {

XposedBridge.log("Child A found.");

childA = value;

//這裏獲得了gLZ

...

}

}

}

});

現在取得了 SnsTimeLineUI.a

的壹個實例 gLZ

,需要取得這個類下的 ListView

類型的 gyO

屬性。

private void dealWithA() throws Throwable{

if (childA == null) {

return;

}

for (Field field : childA.getClass().getDeclaredFields()) { //遍歷屬性

field.setAccessible(true);

Object value = field.get(childA);

if (field.getName().equals("gyO")) { //取得了gyO

ViewGroup vg = (ListView)value;

for (int i = 0; i < vg.getChildCount(); i++) { //遍歷這個ListView的每壹個子View

...

View child = vg.getChildAt(i);

getAllTextViews(child); //這裏調用上文的getAllTextViews()方法,每壹個子View裏的所有TextView的文本

...

}

}

}

}

現在已經可以將朋友圈頁面中的全部文字信息打印出來了。我們需要根據TextView的子類名判斷這些文字是朋友圈內容、好友昵稱、點贊或評論等。

private void dealWithTextView(TextView v) {

String className = v.getClass().getName();

String text = ((TextView)v).getText().toString().trim().replaceAll("\n", " ");

if (!v.isShown())

return;

if (text.equals(""))

return;

if (className.equals("com.tencent.mm.plugin.sns.ui.AsyncTextView")) {

//好友昵稱

...

}

else if (className.equals("com.tencent.mm.plugin.sns.ui.SnsTextView")) {

//朋友圈文字內容

...

}

else if (className.equals("com.tencent.mm.plugin.sns.ui.MaskTextView")) {

if (!text.contains(":")) {

//點贊

...

} else {

//評論

...

}

}

}

自此,我們已經從微信APP裏取得了朋友圈數據。當然,這部分抓取代碼需要定時執行。因為從 ListView

中抓到的數據只有當前顯示在屏幕上的可見部分,為此需要每隔很短壹段時間再次執行,讓用戶在下滑加載的過程中抓取更多數據。

剩下的就是數據分類處理和格式化輸出到文件,受本文篇幅所限不再贅述,詳細實現可參考作者GitHub上的源碼。

  • 上一篇:如何辨別壹個羽毛球拍好不好?
  • 下一篇:我想了解壹下關於“核桃收藏”的常識 越詳細越好!謝謝!
  • copyright 2024吉日网官网