python numpy實(shí)現(xiàn)多次循環(huán)讀取文件 等間隔過濾數(shù)據(jù)示例
numpy的np.fromfile會(huì)出現(xiàn)如下的問題,只能一次性讀取文件的內(nèi)容,不能追加讀取,連續(xù)兩次的np.fromfile讀到的東西一樣
如果數(shù)據(jù)文件太大(幾個(gè)G或以上)不能一次性全讀進(jìn)去,需要追加讀取

而我希望讀到的donser1和donser2是連續(xù)的兩段
(實(shí)際使用時(shí),比如說(shuō)讀取的文件是二進(jìn)制數(shù)據(jù)文件,每一塊文件都包括包頭+數(shù)據(jù),希望將這兩塊分開獲取,然后再做進(jìn)一步處理)
代碼:
import numpy as nplength=2500plt_arr=np.linspace(0.0, 0.0, length*2048*16)start=0tail_size = 40 #40bitnum_size=16*1024-40 # 16kb -40bdef one_file(f, loop): global tail_size, num_size while loop: num = np.fromfile(f, dtype=np.int16, count=num_size) tail=np.fromfile(f, dtype=np.int16, count=tail_size) loop=loop-1 yield num, taildef main(): file_path='E://1-gl300c.r3f' global length, plt_arr, start loop=length with open(file_path, ’rb’) as f: for num, tail in one_file(f, loop): plt_arr[start:start+len(num)]=num[:] start=start+len(num) return plt_arr[0:start]if __name__ == '__main__': donser=main() print(donser)
假設(shè)數(shù)據(jù)文件的格式是 數(shù)據(jù)+包尾,plt_arr存儲(chǔ)全部的數(shù)據(jù)部分,包尾丟棄,該方法實(shí)現(xiàn)了多次連續(xù)追加讀取數(shù)據(jù)文件的內(nèi)容plt_arr最好使用先開好大小再逐次賦值,親測(cè)append方法和concatenate方法時(shí)間效率極差或者不用numpy也可以,代碼:
def read_in_chunks(filePath, chunk_size=16*1024): file_object = open(filePath,’rb’) count=0 while True: chunk_data = file_object.read(chunk_size) if not chunk_data: break yield chunk_data[0:16*1024-28]if __name__ == '__main__': num=0 for chunk in read_in_chunks('E:1-gl300c.r3f'): #process(chunk) # <do something with chunk> name=str(num)+'.bin' num=num+1 if num<303000: continue if num>308001: break file_object = open(name, ’wb’) file_object.write(chunk) file_object.close( )
numpy.fromfile的其他方法可以參考這個(gè)
補(bǔ)充知識(shí):python每隔一段時(shí)間運(yùn)行一個(gè)函數(shù)
用python語(yǔ)言每隔兩分鐘從接口獲取一次數(shù)據(jù)來(lái)插入到數(shù)據(jù)庫(kù)
看了大佬們的方法感覺最簡(jiǎn)單就是:
做一個(gè)死循環(huán),讓函數(shù)執(zhí)行完后休眠兩分鐘,然后進(jìn)入下一次執(zhí)行,除非手動(dòng)停止或者有錯(cuò)誤停止,否則程序會(huì)永遠(yuǎn)運(yùn)行下去。
以下是代碼:
import get_detailsimport timesecond=2*60print secondwhile True:get_details.sign_cycle()time.sleep(second)
上面的代碼就是讓get_details模塊的sign_cycle()函數(shù)每?jī)煞昼妶?zhí)行一次。
是不是超簡(jiǎn)單!!!!!!
以上這篇python numpy實(shí)現(xiàn)多次循環(huán)讀取文件 等間隔過濾數(shù)據(jù)示例就是小編分享給大家的全部?jī)?nèi)容了,希望能給大家一個(gè)參考,也希望大家多多支持好吧啦網(wǎng)。
相關(guān)文章:
1. ASP動(dòng)態(tài)網(wǎng)頁(yè)制作技術(shù)經(jīng)驗(yàn)分享2. vue項(xiàng)目登錄成功拿到令牌跳轉(zhuǎn)失敗401無(wú)登錄信息的解決3. php使用正則驗(yàn)證密碼字段的復(fù)雜強(qiáng)度原理詳細(xì)講解 原創(chuàng)4. JSP+Servlet實(shí)現(xiàn)文件上傳到服務(wù)器功能5. 淺談?dòng)蓀osition屬性引申的css進(jìn)階討論6. ASP 信息提示函數(shù)并作返回或者轉(zhuǎn)向7. 基于javaweb+jsp實(shí)現(xiàn)企業(yè)財(cái)務(wù)記賬管理系統(tǒng)8. CSS可以做的幾個(gè)令你嘆為觀止的實(shí)例分享9. vue前端RSA加密java后端解密的方法實(shí)現(xiàn)10. asp批量添加修改刪除操作示例代碼

網(wǎng)公網(wǎng)安備