職位描述
崗位職責(zé)1.負(fù)責(zé)OCR相關(guān)大模型(如文本檢測、識別、結(jié)構(gòu)化理解、多模態(tài)等方向)的算法研發(fā)、優(yōu)化及落地應(yīng)用。2.跟蹤學(xué)術(shù)界與工業(yè)界OCR領(lǐng)域的前沿技術(shù)(如Transformer-based模型、端到端系統(tǒng)、多語言支持等),推動(dòng)技術(shù)迭代。3.針對復(fù)雜場景(如低質(zhì)量圖像、多語言、手寫體、表格、票據(jù)等)設(shè)計(jì)高效的OCR解決方案。4.參與大模型訓(xùn)練與調(diào)優(yōu)(包括數(shù)據(jù)構(gòu)建、分布式訓(xùn)練、模型壓縮、推理加速等)。5.與工程團(tuán)隊(duì)合作,實(shí)現(xiàn)算法的高效部署,滿足性能、精度和穩(wěn)定性要求。6.輸出技術(shù)專利、論文或開源項(xiàng)目,提升團(tuán)隊(duì)技術(shù)影響力。崗位要求1.計(jì)算機(jī)、數(shù)學(xué)、電子工程等相關(guān)專業(yè)碩士及以上學(xué)歷,3年以上OCR或深度學(xué)習(xí)研發(fā)經(jīng)驗(yàn)。2.精通OCR領(lǐng)域核心技術(shù)(如CNN/Transformer、CRNN、Attention-based模型、DBNet等),熟悉主流框架(PaddleOCR、MMOCR等)。3.熟悉大模型技術(shù)棧(如LLM、多模態(tài)模型訓(xùn)練、****優(yōu)化、LoRA微調(diào)等),有實(shí)際項(xiàng)目經(jīng)驗(yàn)者優(yōu)先。4.扎實(shí)的編程能力(Python/C++),熟練使用PyTorch/TensorFlow,熟悉分布式訓(xùn)練和性能優(yōu)化。5.具備較強(qiáng)的論文復(fù)現(xiàn)能力,能快速驗(yàn)證新算法的有效性。加分項(xiàng)6.在ICDAR、CVPR等會議發(fā)表過OCR相關(guān)論文,或有開源項(xiàng)目貢獻(xiàn)。7.熟悉文檔結(jié)構(gòu)化、信息抽取(如LayoutLM、Donut等模型)。8.有海量數(shù)據(jù)訓(xùn)練或超大模型(10B+參數(shù)量)優(yōu)化經(jīng)驗(yàn)。9.熟悉模型量化、剪枝、ONNX/TensorRT部署等工程化技術(shù)。
企業(yè)介紹
1、團(tuán)隊(duì):核心成員組成阿里,華為,百度
2、產(chǎn)品:輿情監(jiān)測方向
3、上海總部,武漢研發(fā)中心,北京分公司下半年
4、上海辦公地點(diǎn):上海市靜安區(qū)彭江路大寧易園