2013年11月1日 星期五

[轉貼] 獲取網頁中的驗證碼圖片

出處:http://www.cnblogs.com/hobe/archive/2007/03/14/674292.html

有時候我們需要獲得網頁上的圖片,尤其是向驗證碼這樣的圖片.這個方法就是將網頁上的圖片獲取到PictureBox中.效果入下圖所示.


右邊是使用Webbrowser控件裝載的某網站的注冊頁面,其中包括了驗證碼.左邊是獲取到的驗證碼,裝載在PictureBox中.也許有人會問,通過Webbrowser也能夠看到注冊頁面的驗證碼為什麼還要,在獲得這個驗證碼.原因如下:當你不想讓別人知道在做什麼的時候需要使用,別人只能看到注冊碼而不知道在干什麼事情;另外願意是為了方便,當做這個一個注冊程序的時候,注冊信息一般都是自動生成的,但是驗證碼需要輸入,不停的拖動滾動條找注冊碼的位置不方便.

下面看看如何實現.

首先需要添加mshtml的引用,之後using mshtml;
        public static Image GetRegCodePic(WebBrowser wbMail, string ImgName, string Src, string Alt)
        
{
            HTMLDocument doc 
= (HTMLDocument)wbMail.Document.DomDocument;
            HTMLBody body 
= (HTMLBody)doc.body;
            IHTMLControlRange rang 
= (IHTMLControlRange)body.createControlRange();
            IHTMLControlElement Img;
            
if (ImgName == ""//如果沒有圖片的名字,通過Src或Alt中的關鍵字來取
            {
                
int ImgNum = GetPicIndex(wbMail, Src,Alt);
                
if (ImgNum == -1return null;
                Img 
= (IHTMLControlElement)wbMail.Document.Images[ImgNum].DomElement;
            }

            
else
                Img 
= (IHTMLControlElement)wbMail.Document.All[ImgName].DomElement;

            rang.add(Img);
            rang.execCommand(
"Copy"falsenull);
            Image RegImg 
= Clipboard.GetImage();
            Clipboard.Clear();
            
return RegImg;
        }


        
public static int GetPicIndex(WebBrowser wbMail, string Src, string Alt)
        
{
            
int imgnum = -1;
            
for (int i = 0; i < wbMail.Document.Images.Count; i++) //獲取所有的Image元素
            {
                IHTMLImgElement img 
= (IHTMLImgElement)wbMail.Document.Images[i].DomElement;
                
if (Alt == "")
                
{
                    
if (img.src.Contains(Src)) return i;
                }

                
else
                
{
                    
if (!string.IsNullOrEmpty(img.alt))
                    
{
                        
if (img.alt.Contains(Alt)) return i;
                    }

                }

            }

            
return imgnum;
        }



通過調用GetRegCodePic就可以獲得注冊碼圖片了.下面是幾個示例.
示例1:
下面是某個站的注冊碼圖片的HTML部分源代碼

<IMG height=80 alt="Registration Verification Code" src="......" width=290 border=0>

picturebox1.Image =GetRegCodePic(wbMail, "", "", "Registration Verification Code")


示例2:
下面是某個站的注冊碼圖片的HTML部分源代碼

<IMG id=CAPTCHAImage src="......." name=CAPTCHAImage>

picturebox1.Image =GetRegCodePic(wbMail, "CAPTCHAImage", "", "")  //通過驗證碼Html元素的名字來取

沒有留言:

張貼留言