python numpy實(shí)現(xiàn)多次循環(huán)讀取文件 等間隔過濾數(shù)據(jù)示例
numpy的np.fromfile會出現(xiàn)如下的問題,只能一次性讀取文件的內(nèi)容,不能追加讀取,連續(xù)兩次的np.fromfile讀到的東西一樣
如果數(shù)據(jù)文件太大(幾個G或以上)不能一次性全讀進(jìn)去,需要追加讀取
而我希望讀到的donser1和donser2是連續(xù)的兩段
(實(shí)際使用時(shí),比如說讀取的文件是二進(jìn)制數(shù)據(jù)文件,每一塊文件都包括包頭+數(shù)據(jù),希望將這兩塊分開獲取,然后再做進(jìn)一步處理)
代碼:
import numpy as nplength=2500plt_arr=np.linspace(0.0, 0.0, length*2048*16)start=0tail_size = 40 #40bitnum_size=16*1024-40 # 16kb -40bdef one_file(f, loop): global tail_size, num_size while loop: num = np.fromfile(f, dtype=np.int16, count=num_size) tail=np.fromfile(f, dtype=np.int16, count=tail_size) loop=loop-1 yield num, taildef main(): file_path='E://1-gl300c.r3f' global length, plt_arr, start loop=length with open(file_path, ’rb’) as f: for num, tail in one_file(f, loop): plt_arr[start:start+len(num)]=num[:] start=start+len(num) return plt_arr[0:start]if __name__ == '__main__': donser=main() print(donser)
假設(shè)數(shù)據(jù)文件的格式是 數(shù)據(jù)+包尾,plt_arr存儲全部的數(shù)據(jù)部分,包尾丟棄,該方法實(shí)現(xiàn)了多次連續(xù)追加讀取數(shù)據(jù)文件的內(nèi)容plt_arr最好使用先開好大小再逐次賦值,親測append方法和concatenate方法時(shí)間效率極差或者不用numpy也可以,代碼:
def read_in_chunks(filePath, chunk_size=16*1024): file_object = open(filePath,’rb’) count=0 while True: chunk_data = file_object.read(chunk_size) if not chunk_data: break yield chunk_data[0:16*1024-28]if __name__ == '__main__': num=0 for chunk in read_in_chunks('E:1-gl300c.r3f'): #process(chunk) # <do something with chunk> name=str(num)+'.bin' num=num+1 if num<303000: continue if num>308001: break file_object = open(name, ’wb’) file_object.write(chunk) file_object.close( )
numpy.fromfile的其他方法可以參考這個
補(bǔ)充知識:python每隔一段時(shí)間運(yùn)行一個函數(shù)
用python語言每隔兩分鐘從接口獲取一次數(shù)據(jù)來插入到數(shù)據(jù)庫
看了大佬們的方法感覺最簡單就是:
做一個死循環(huán),讓函數(shù)執(zhí)行完后休眠兩分鐘,然后進(jìn)入下一次執(zhí)行,除非手動停止或者有錯誤停止,否則程序會永遠(yuǎn)運(yùn)行下去。
以下是代碼:
import get_detailsimport timesecond=2*60print secondwhile True:get_details.sign_cycle()time.sleep(second)
上面的代碼就是讓get_details模塊的sign_cycle()函數(shù)每兩分鐘執(zhí)行一次。
是不是超簡單!!!!!!
以上這篇python numpy實(shí)現(xiàn)多次循環(huán)讀取文件 等間隔過濾數(shù)據(jù)示例就是小編分享給大家的全部內(nèi)容了,希望能給大家一個參考,也希望大家多多支持好吧啦網(wǎng)。
相關(guān)文章:
1. 詳解Python模塊化編程與裝飾器2. java結(jié)構(gòu)性模式之變壓器模式介紹(二)3. JavaScript中的AOP編程的基本實(shí)現(xiàn)4. Spring security 自定義過濾器實(shí)現(xiàn)Json參數(shù)傳遞并兼容表單參數(shù)(實(shí)例代碼)5. python使用ctypes庫調(diào)用DLL動態(tài)鏈接庫6. PHP VS ASP7. Django實(shí)現(xiàn)任意文件上傳(最簡單的方法)8. Django框架安裝及項(xiàng)目創(chuàng)建過程解析9. 詳解python程序中的多任務(wù)10. 多級聯(lián)動下拉選擇框,動態(tài)獲取下一級
