中文字幕av专区_日韩电影在线播放_精品国产精品久久一区免费式_av在线免费观看网站

溫馨提示×

溫馨提示×

您好,登錄后才能下訂單哦!

密碼登錄×
登錄注冊×
其他方式登錄
點擊 登錄注冊 即表示同意《億速云用戶服務條款》

golang中bufio.SplitFunc的深入理解

發布時間:2020-09-24 20:25:27 來源:腳本之家 閱讀:113 作者:goland 欄目:編程語言

前言

bufio模塊是golang標準庫中的模塊之一,主要是實現了一個讀寫的緩存,用于對數據的讀取或者寫入操作。該模塊在多個涉及io的標準庫中被使用,比如http模塊中使用buffio來完成網絡數據的讀寫,壓縮文件的zip模塊利用bufio來操作文件數據的讀寫等。

golang的bufio包里面定以的SplitFunc是一個比較重要也比較難以理解的東西,本文希望通過結合簡單的實例介紹SplitFunc的工作原理以及如何實現一個自己的SplitFunc。

一個例子

在bufio包里面定義了一些常用的工具比如Scanner,你可能需要讀取用戶在標準輸入里面輸入的一些東西,比如我們做一個復讀機,讀取用戶的每一行輸入,然后打印出來:

package main
import (
 "bufio"
 "fmt"
 "os"
)
func main() {
 scanner := bufio.NewScanner(os.Stdin)
 scanner.Split(bufio.ScanLines)
 for scanner.Scan() {
 fmt.Println(scanner.Text())
 }
}

這個程序很簡單,os.Stdin實現了io.Reader接口,我們從這個reader創建了一個scanner,設置分割函數為bufio.ScanLines,然后for循環,每次讀到一行數據就將文本內容打印出來。麻雀雖小五臟俱全,這個小程序雖然簡單,卻引出了我們今天要介紹的對象: bufio.SplitFunc,它的定義是這個樣子的:

package "buffio"
type SplitFunc func(data []byte, atEOF bool) (advance int, token []byte, err error)

golang官方文檔的描述是這個樣子的:

SplitFunc is the signature of the split function used to tokenize the input. The arguments are an initial substring of the remaining unprocessed data and a flag, atEOF, that reports whether the Reader has no more data to give. The return values are the number of bytes to advance the input and the next token to return to the user, if any, plus an error, if any.

Scanning stops if the function returns an error, in which case some of the input may be discarded.

Otherwise, the Scanner advances the input. If the token is not nil, the Scanner returns it to the user. If the token is nil, the Scanner reads more data and continues scanning; if there is no more data--if atEOF was true--the Scanner returns. If the data does not yet hold a complete token, for instance if it has no newline while scanning lines, a SplitFunc can return (0, nil, nil) to signal the Scanner to read more data into the slice and try again with a longer slice starting at the same point in the input.

The function is never called with an empty data slice unless atEOF is true. If atEOF is true, however, data may be non-empty and, as always, holds unprocessed text.

英文!參數這么多!返回值這么多!好煩!不知道各位讀者遇到這種文檔會不會有這種感覺...正式由于這種情況,我才決定寫一篇文章介紹一下SplitFunc的具體工作原理,用一種通俗的方式結合具體實例加以說明,希望對讀者有所幫助。
好了,廢話少說,開始正題吧!

Scanner和SplitFunc的工作機制

package "buffio"
type SplitFunc func(data []byte, atEOF bool) (advance int, token []byte, err error)

Scanner是有緩存的,意思是Scanner底層維護了一個Slice用來保存已經從Reader中讀取的數據,Scanner會調用我們設置SplitFunc,將緩沖區內容(data)和是否已經輸入完了(atEOF)以參數的形式傳遞給SplitFunc,而SplitFunc的職責就是根據上述的兩個參數返回下一次Scan需要前進幾個字節(advance),分割出來的數據(token),以及錯誤(err)。

這是一個通信雙向的過程,Scanner告訴我們的SplitFunc已經掃描到的數據和是否到結尾了,我們的SplitFunc則根據這些信息將分割的結果返回和下次掃描需要前進的位置返回給Scanner。用一個例子來說明:

package main
import (
 "bufio"
 "fmt"
 "strings"
)
func main() {
 input := "abcdefghijkl"
 scanner := bufio.NewScanner(strings.NewReader(input))
 split := func(data []byte, atEOF bool) (advance int, token []byte, err error) {
  fmt.Printf("%t\t%d\t%s\n", atEOF, len(data), data)
  return 0, nil, nil
 }
 scanner.Split(split)
 buf := make([]byte, 2)
 scanner.Buffer(buf, bufio.MaxScanTokenSize)
 for scanner.Scan() {
  fmt.Printf("%s\n", scanner.Text())
 }
}

輸出

false 2 ab
false 4 abcd
false 8 abcdefgh
false 12 abcdefghijkl
true 12 abcdefghijkl

這里我們把緩沖區的初始大小設置為了2,不夠的時候會擴展為原來的2倍,最大為bufio.MaxScanTokenSize,這樣一開始掃描2個字節,我們的緩沖區就滿了,reader的內容還沒有讀取到EOF,然后split函數執行,輸出:

false 2 ab

緊接著函數返回 0, nil, nil這個返回值告訴Scanner數據不夠,下次讀取的位置前進0位,需要繼續從reader里面讀取,此時因為緩沖區滿了,所以容量擴展為2 * 2 = 4,reader的內容還沒有讀取到EOF,輸出

false 4 abcd

重復上述步驟,一直到最后全部內容讀取完了,EOF此時變成了true

true 12 abcdefghijkl

看了上面的過程是不是對SplitFunc的工作原來有了一點理解了呢?再回頭看一下golang的官方文檔有沒有覺得稍微理解了一點?下面是bufio.ScanLines的實現,讀者可以自己研究一下該函數是如何工作的

標準庫里的ScanLines

func ScanLines(data []byte, atEOF bool) (advance int, token []byte, err error) {
 // 表示我們已經掃描到結尾了
 if atEOF && len(data) == 0 {
  return 0, nil, nil
 }
 // 找到\n的位置
 if i := bytes.IndexByte(data, '\n'); i >= 0 {
  // 把下次開始讀取的位置向前移動i + 1位
  return i + 1, dropCR(data[0:i]), nil
 }
 // 這里處理的reader內容全部讀取完了,但是內容不為空,所以需要把剩余的數據返回
 if atEOF {
  return len(data), dropCR(data), nil
 }
 // 表示現在不能分割,向Reader請求更多的數據
 return 0, nil, nil
}

參考

In-depth introduction to bufio.Scanner in Golang

總結

以上就是這篇文章的全部內容了,希望本文的內容對大家的學習或者工作具有一定的參考學習價值,如果有疑問大家可以留言交流,謝謝大家對億速云的支持。

向AI問一下細節

免責聲明:本站發布的內容(圖片、視頻和文字)以原創、轉載和分享為主,文章觀點不代表本網站立場,如果涉及侵權請聯系站長郵箱:is@yisu.com進行舉報,并提供相關證據,一經查實,將立刻刪除涉嫌侵權內容。

AI

梁山县| 墨江| 介休市| 荃湾区| 泾川县| 扶余县| 台前县| 新巴尔虎右旗| 汪清县| 大荔县| 米林县| 德州市| 准格尔旗| 北川| 临安市| 罗平县| 海兴县| 贡觉县| 邯郸市| 望奎县| 峡江县| 固始县| 德江县| 富宁县| 浦北县| 嵩明县| 台前县| 金乡县| 界首市| 抚州市| 阜城县| 广元市| 芜湖县| 台中市| 南溪县| 嘉兴市| 汽车| 南雄市| 克什克腾旗| 德清县| 吉木萨尔县|