信息學(xué)院張海鵬課題組在金融與人文數(shù)據(jù)挖掘領(lǐng)域取得新進(jìn)展

ON2025-11-24CATEGORY科研進(jìn)展

上海科技大學(xué)信息科學(xué)與技術(shù)學(xué)院張海鵬課題組致力于數(shù)據(jù)挖掘的理論與應(yīng)用研究,探索金融、人文、社交等領(lǐng)域的大規(guī)模人類(lèi)行為的規(guī)律、影響和機(jī)制,支持相關(guān)領(lǐng)域的智能決策。近日,課題組在風(fēng)險(xiǎn)投資成功預(yù)測(cè)、古詩(shī)詞情感分析方面取得兩項(xiàng)研究成果,發(fā)表于國(guó)際學(xué)術(shù)期刊ACM Transactions on Intelligent Systems and Technology (ACM TIST) 和國(guó)際人工智能聯(lián)合會(huì)議(International Joint Conference on Artificial Intelligence, IJCAI)。


基于動(dòng)態(tài)圖神經(jīng)網(wǎng)絡(luò)的風(fēng)險(xiǎn)投資成功預(yù)測(cè)方法

識(shí)別具有高潛力的初創(chuàng)企業(yè)對(duì)風(fēng)險(xiǎn)投資(VC)機(jī)構(gòu)和政策制定者至關(guān)重要,但大多數(shù)初創(chuàng)企業(yè)最終都會(huì)失敗,早期階段企業(yè)的存活率更低。課題組基于全球40年的風(fēng)險(xiǎn)投資數(shù)據(jù),將VC生態(tài)系統(tǒng)建模為連接初創(chuàng)企業(yè)與個(gè)人(投資者/管理團(tuán)隊(duì))的動(dòng)態(tài)二部圖網(wǎng)絡(luò)(圖1),提出了一種預(yù)測(cè)初創(chuàng)企業(yè)在首輪融資后5年內(nèi)能否成功的方法(圖2)。實(shí)驗(yàn)表明,該模型能夠識(shí)別出成功概率是專(zhuān)業(yè)投資者所選企業(yè)兩倍的早期初創(chuàng)企業(yè)。模型識(shí)別出人脈資源、教育背景等關(guān)鍵成功因素,與風(fēng)險(xiǎn)投資文獻(xiàn)的研究結(jié)論一致。

 

圖1 風(fēng)險(xiǎn)投資生態(tài)系統(tǒng)示意圖。


圖2 風(fēng)險(xiǎn)投資成功預(yù)測(cè)模型圖。

 

成果以題為“Help Me Screen: Analyzing and Predicting the Success of Start-ups in Dynamic Venture Capital Networks”發(fā)表在ACM TIST期刊上。上??萍即髮W(xué)是第一完成單位,信息學(xué)院碩士畢業(yè)生呂世偉、李笑風(fēng)為論文的共同第一作者,美國(guó)馬里蘭大學(xué)張坤鵬教授、上科大張海鵬教授為共同通訊作者。相關(guān)課題曾獲上海市金融學(xué)會(huì)青年課題一等獎(jiǎng),并入選《上海科技年鑒》。

論文鏈接:https://dl.acm.org/doi/pdf/10.1145/3763001 

 

多模態(tài)中華古典詩(shī)歌情感分析框架

中華古典詩(shī)歌的情感表達(dá)不僅依賴(lài)文字內(nèi)涵,更通過(guò)韻律節(jié)奏與畫(huà)面意象共同傳遞(圖3)?,F(xiàn)有研究多聚焦于文本分析,忽略了詩(shī)歌特有的音韻特征與視覺(jué)元素,導(dǎo)致情感理解不夠全面。為此,課題組設(shè)計(jì)了一種融合語(yǔ)音、視覺(jué)與文本的三模態(tài)中文表征框架(圖4),首次將方言音頻特征與生成式視覺(jué)特征引入古典詩(shī)歌的情感分析中。該框架在公開(kāi)數(shù)據(jù)集上達(dá)到最優(yōu)性能。研究還發(fā)現(xiàn),方言特征對(duì)地域性詩(shī)歌的情感分類(lèi)具有顯著提升作用。

 

圖3 中華詩(shī)詞的音韻、意象與文本語(yǔ)義示例。


圖4 多模態(tài)中華古典詩(shī)歌情感分析框架。

 

成果以“Picturized and Recited with Dialects: A Multimodal Chinese Representation Framework for Sentiment Analysis of Classical Chinese Poetry”為題發(fā)表于IJCAI 2025。上海科技大學(xué)是第一完成單位,信息學(xué)院2023級(jí)碩士研究生杜曉聰、2024級(jí)碩士研究生裴昊宇為共同第一作者,張海鵬教授為通訊作者。

論文鏈接:https://www.ijcai.org/proceedings/2025/0310.pdf