(1.大连海洋大学信息工程学院,辽宁省海洋信息技术重点实验室,辽宁大连116023;2.设施渔业教育部重点实验室(大连海洋大学),辽宁大连116023;3.大连市智慧渔业重点实验室,辽宁大连116023)
摘要:大模型是具有大量参数和复杂结构的机器学习基础模型,目前正在逐渐成为科技发展的重要方向之一。本文阐述了大模型应用的核心技术,并探讨了其运行所需的基本条件及大模型在辅助水产养殖病害防治中的具体应用,包括大模型辅助水产养殖病害防治与管理、协同水产养殖环境监测与疾病防治、水产药物研发、水产动物疾病抗性培育组学技术中的应用,并从数据获取与处理、模型适应性与泛化能力、计算资源与训练成本、隐私与安全、模型解释性与用户接受度、多任务学习与优先级管理、跨区域数据共享与合作、知识图谱增强大模型集成与利用等方面提出了大模型的未来发展趋势,以期为大模型在水产养殖病害防治领域的进一步应用提供有力支持,推动水产养殖业向更高效、可持续的方向发展。
关键词:大模型;水产养殖;病害防治;智慧化;深度学习
传统水产养殖病害防治方法面临病原多样性和环境变化的挑战,智慧化手段逐渐成为解决此类问题的重要方向。早期的智慧化手段以专家诊断系统为主[2],但受限于知识库广度和更新频率。随着大数据和人工智能技术的发展,知识图谱成为解决之道,其能挖掘实体间的深层联系,提供强大数据支撑,打破数据隔阂,助力海洋数据应用[3-7]。这种智慧化方案不仅能提供传统解答,还能通过学习和更新知识库提高诊断预测的准确性,为水产养殖业的可持续发展提供强大技术支持,使病害管理更加科学、高效。
随着水产养殖规模的扩大和数据量的激增,传统的智慧化分析方法在处理能力上逐渐受限。以ChatGPT为代表的人工智能大模型引发了社会热议,各行业均已感受到人工智能发展引发的变化[8]。大模型的应用为水产养殖病害防治领域带来了革命性的改变。如丁博等[9]通过广义线性模型分析了大青鲨(Prionaceglauca)的钩捕死亡率与潜在因素,为资源可持续利用提供了科学依据。李秀超等[10]则构建了针对印度洋金枪鱼渔业的多物种生态系统模型,并进行了结构性改进,为渔业管理提供了重要参考。Rasmy等[11]设计的预训练模型加速了人工智能在健康领域的应用,而Yang等[12]将大模型预训练语言模型应用于单细胞测序技术,有望在肿瘤微环境研究上取得突破。
大模型在应对复杂问题、提供前瞻性解决方案等方面的显著优势[13],使其成为水产养殖病害防治技术发展的重要方向,也是推动水产养殖业可持续发展的关键策略。面对日益复杂的水产养殖病害挑战,应用大模型不仅是必要的,更是实现病害防治科学化、高效化的重要武器。本文综述了大模型应用的核心技术,并探讨了其在水产养殖病害防治中的具体应用,以期推动水产养殖业向更高效、可持续的方向发展。
大模型通常是指具有大量参数和复杂结构的机器学习基础模型,其范围涵盖了多个领域。狭义上,大模型主要指大语言模型(largelanguagemodels,LLMs),如GPT-3和GPT-4等[14-15],其具有数十亿至数千亿个参数,可用于自然语言处理任务,如文本生成、摘要和翻译等。而广义上,大模型还包括机器视觉大模型(用于图像识别、分割和生成等任务)、科学计算大模型(用于解决复杂的科学计算问题)及多模态大模型(可以处理多种不同类型的数据,如文本、图像、音频等)。这些大模型在各自领域都取得了显著的成就,推动了人工智能技术的发展和应用。
大模型发展主要经历了3个阶段,分别是萌芽期、探索沉淀期和迅猛发展期[16-17](图1)。各类大模型都具备大量参数和复杂的结构,但其服务于不同的技术需求和解决方案。
图1AI大模型发展主要阶段及其代表模型
Fig.1MaindevelopmentalstagesandrepresentativesofAIlargemodels
大模型的不同发展阶段标志着大模型在语言理解和生成能力上的持续提升,推动了自然语言处理技术的发展,并为未来人工智能在语言处理领域的应用提供了新的可能性。
按照输入数据的类型不同,大模型可分为大语言模型、机器视觉大模型、科学计算大模型和多模态大模型(表1)。
表1大模型分类
Tab.1Classificationoflargemodels
类别category适用场景applicablescenarios描述description技术架构technicalarchitecture应用领域applicationdomain代表模型representativemodel大语言模型largelanguagemodel处理自然语言任务通过大模型预训练学习语言的深层次结构和语义Transformer自然语言处理、对话系统和文本生成等OpenAI、ERNIEBot(文心一言)和BERT机器视觉大模型largemachinevisionmodel处理视觉领域任务使用卷积神经网络或VisionTransformer处理图像数据卷积神经网络、ViT图像分类、目标检测和图像生成等ResNet、ViT、VGG、HuaweiPanguCV(华为盘古)和Intern科学计算大模型largescientificcomputingmodel用于科学研究和计算任务结合多种数据类型和模型结构适应复杂科学问题各种架构结合物理模拟、化学预测和生物信息学等AlphaFold多模态大模型largemulti-modalmodel同时处理和理解多种类型的数据,执行跨媒体任务通过整合不同模态的信息进行图像标注、视频内容理解等多模态融合架构图像标注、视频内容理解和多模态学习等CLIP、DALL-E和Din-goDB
按照应用领域的不同,大模型主要包括通用大模型和行业垂直大模型两个层级。其中,通用大模型是指可以在多个领域和任务上通用的大模型,相当于AI完成了“通识教育”(表2、表3);行业垂直大模型是指针对特定行业领域、特定任务或场景的大模型,其相当于AI成为“行业专家”,表4列举了当前较为常见的行业大模型。
表2常见通用大模型(国外开发者)
Tab.2Commongeneral-purposelargemodels(foreigndevelopers)
模型名称modelname开发者developer基座模型/架构basemodel/architecture开源opensource参数量numberofparameter核心功能corefunctionGPT-4.0[18]OpenAITransformer否1.8万亿文本生成、自然语言理解、翻译、情感分析和问答GPT-3.5[19]OpenAITransformer否1750亿文本生成、翻译和问答GPT-2.0[20]OpenAITransformer是15亿语言理解和文本生成Gemini[21]GoogleTransformer是1.8万亿语言生成、翻译、图像识别和问答Claude[22]AnthropicGPT-3否62亿会话式助手、多模态功能LLaMa[23]MetaTransformer是70~650亿无条件长文本生成,如对话生成和故事生成等Bert[24]GoogleTransformer是1.1亿/3.4亿强调上下文理解、自然语言理解,如事实推断、语法分析和文本分类CLIP[25]OpenAICNN/RNN/Transformer是4亿通过自然语言和图像联合学习,理解图像内容和描述ViT[26]GoogleTransformer是8.5~10亿Transformer架构应用于视觉任务
表3常见通用大模型(国内开发者)
Tab.3Commongeneral-purposelargemodels(domesticdevelopers)
模型名称modelname开发者developer基座模型/架构basemodel/architecture开源opensource参数量numberofparameter核心功能corefunction盘古模型[27]Pangu华为Mindspore否1000亿自然语言处理、计算机视觉、多模态和科学计算悟道[28]Wudao腾讯悟道·天鹰Aquila语言大模型是1.75万亿问题解决、内容生成和预测文心一言[29]ERNIEBot百度飞桨深度学习平台和文心知识增强大模型是2600亿语言生成、信息获取、知识协助和创作支持通义千问[30]Qwen阿里巴巴Qwen-7B是70亿~700亿人机自然语言对话、文案创作和疑问解答星火认知大模型[31]SparkDesk科大讯飞Transformer是130亿文本生成、分类、摘要、翻译、语音识别、情感分析和知识图谱ChatGLM6B[32]清华大学、智谱AIGLM是60亿文本生成式对话模型,可以用于问答和闲聊等多种场景紫东太初[33]ZidongTaichu中科院自动化所MindSpore是千亿级全球首个图文音(视觉-文本-语音)三模态预训练模型混元大模型[34]TencentHunyuan腾讯GLM是超千亿自然语言理解、任务执行和问题解决
表4行业大模型
Tab.4Domain-specificlargemodels
Note:Otherunspecifiedsourceinformationisextractedfromrelevantinternetreports.
模型名称modelname基座模型/架构basemodel/architecture模型名称modelname基座模型/架构basemodel/architecture腾讯金融大模型[35]TencentFinancialLargeLanguageModel混元大模型IndustryGPTSMoreLrMo本草[36]BenTsaoLLaMa-7B轩辕70BXuanYuan-70BBloomChatLaw-33B[37]Anima-33BCOSMO-GPTGPTDISC-FinLLM[38]Baichuan-13B-Chat佳都知行交通大模型JiaduZhixingTransportationAIModelTransformerLangCel[39]Geneformer后稷AgriMABaichuan单细胞基因数据分析大模型[12]scBERTTransformerEcomGPT[41]BLOOMZMedGPT[40]Transformer天机·军事大模型TianjiMilitaryAIModelTransformer、LSTM、DRL等范蠡大模型1.0FanliModel1.0TaskFormer神经网络架构羲和海洋预报大模型XiheSwin-Transformer
1.3.1基础大模型选型基础大模型选型在构建高效人工智能系统中至关重要。在选择基础大模型时,需评估其架构特性、预训练深度及历史表现。如针对自然语言处理任务,可优先考虑像GPT或BERT这样的预训练语言模型;而对于图像识别任务,则可能选择ResNet或VGG模型[42]。选型过程还需考虑模型的可扩展性、兼容性及部署成本。精确选型可确保AI系统在特定应用中实现高效学习与推理、优化整体性能和资源利用率、加速开发周期,并在竞争激烈的技术市场中保持领先地位。
1.3.2高质量数据管理高质量数据管理是大模型性能优化的核心环节,包括数据采集、数据标注和数据回流[43]。这3个阶段的高质量数据管理有助于提高大模型的性能和适应能力,在各种应用场景中均能达到最佳效果。
1.3.3提示工程提示工程在大模型应用中尤其在自然语言处理领域发挥核心作用。其主要通过设计有效的提示,激活并引导模型(如GPT系列的预训练语言模型)生成特定输出或执行任务[44]。这种方法主要依赖零样本、少样本学习及链式推理,优化模型在特定任务上的表现,同时发掘模型内部的知识,避免从头开始训练。提示工程提高了大模型在内容生成、情感分析和问题解答等场景的灵活性和效率,使其能快速适应新任务和挑战。
1.3.5人类反馈的强化学习人类反馈的强化学习在大模型优化和适应性提升中发挥着关键作用[46]。该技术通过集成人类评价反馈,指导和调整预训练模型(如GPT系列),以更精确完成任务或生成更符合预期的输出。人类反馈的强化学习显著增强了大模型在对话系统、游戏智能、客服自动化等领域的表现和可靠性,可更好地满足用户需求,提升用户体验,扩展大模型的实用性和应用范围。
1.3.6大模型可解释性大模型通常是黑盒模型,无法有效追踪和解释其训练与推理过程。这在实际应用中,特别是在高可靠性领域,势必会引发安全问题与巨大风险。目前,大模型的涌现机制尚未明确。由于大模型自身面临解释性不足、知识实时性差和生成结果存在虚假信息等诸多挑战,亟需探索和开发适用于大模型的解释技术,以提高模型的透明度和可解释性。这不仅是理解大模型的基础,也是推动其实际应用和下一代大模型发展的关键。
1.3.7模型安全和隐私保护大模型需要大量的数据进行训练,这些数据可能包括敏感信息,如果模型的训练过程或内部结构被外部访问,将可能导致严重的数据泄露问题。由于目前缺乏数据收集及使用规范,大模型隐私泄露也是医疗人工智能发展存在的普遍问题。
大模型的有效运行和性能表现依赖几个基本条件,这些条件对于确保大模型能够处理复杂的任务和大模型数据至关重要。
1.4.1充足的数据资源大模型的训练和优化需要依赖于大量的数据。这不仅包括数据的数量,还包括数据的质量和多样性。充足的数据资源可以确保大模型能够学习到足够的特征和模式,从而提高其泛化能力和应对各种场景的能力。
1.4.3专业的技术团队一个由数据科学家、机器学习工程师和领域专家组成的技术团队是运行大模型的关键。这个团队不仅负责模型的设计和开发,还需进行模型的维护、优化和更新,以确保大模型在实际应用中的表现符合预期。
1.4.4高效的算法和技术使用最新和最有效的算法和技术是实现大模型高效运行的重要条件。这包括但不限于算法优化、模型简化和自动化调参等技术,这些技术有助于提升模型的性能,降低对资源的需求,并提高模型的可扩展性和可维护性。
除此之外,运行大模型还应考虑硬件加速与分布式训练[48]、模型压缩与部署优化[49],以及模型监控与维护[50]等因素。
随着水产养殖规模的扩大,水产动物疾病的暴发已成为影响产业可持续发展的重要因素,然而,传统防治方法面对病原多样性和环境变化的挑战时显得力不从心,迫切需要新的技术解决方案。
尽管目前围绕大模型在水产养殖病害防治领域应用的详尽探讨尚显不足,但借鉴大模型在人类医学领域的成功应用案例[51-52],或许能为解决水产养殖病害防治问题开辟新的研究方向与思路。这些跨行业的成功案例不仅为研究者提供了技术层面的启示,还可能启发研究者在水产养殖病害管理中采用更为精准、高效的方法。应用大模型辅助水产养殖病害防治的场景如图2所示。
图2大模型在辅助水产养殖病害防治中的应用场景
Fig.2Applicationscenariosoflargemodel-assisteddiseasepreventionandcontrolinaquaculture
据统计,全国水产养殖病害种类高达200余种,常见病害达数十种,病害已成为制约水产养殖业发展的重要因素之一。有效防治水产养殖病害对于保障水产动物健康、提高养殖效益至关重要。然而,病害的早期发现与防控一直是亟需解决的问题。传统的诊断方法受限于人的经验和感官能力,难以准确识别病害的早期迹象。因此,预警预报已成为水产养殖病害管理领域的焦点和核心策略,“预防先行,重于治疗”的理念在水产动物病害防控中占据主导地位[53]。而大模型技术的出现,为这一问题的解决提供了新的思路。
2.1.2病害早期迹象视觉监测传统的视觉监测方法无法实时捕捉养殖生物的异常行为和外观变化,导致病害发现不及时。视觉大模型可以实时分析来自水下摄像头的视频流,以监测和识别养殖生物的异常行为和外观变化,如鱼体颜色变化、伤口和异常游动模式[55]。此外,视觉大模型还可用于定量分析图像中的微小变化(如对比度和纹理变化),这些细微差异可能预示了病害的早期发展。如视觉大模型可以持续监控鱼群的健康状态,当模型检测到鱼群的异常行为(如游动缓慢或频繁跳跃),则会指示缺氧或其他健康问题。快速识别这些行为可以即时触发预警,允许及时干预,以减少疾病造成的损失。
2.1.3跨模态数据融合分析单一数据源往往无法提供全面的养殖环境和生物健康状况信息,导致诊断结果不准确。多模态模型结合了语言、视觉及其他感测数据(如声音或水质传感器数据),提供了一个综合的分析平台[56]。这使得大模型不仅能理解单一数据源的信息,还能通过跨模态数据分析更全面地了解养殖环境和动物的状态,如结合语言数据和水质传感器数据,同时可以分析图像、文本记录和水质数据,提供更全面的诊断。如果水质监测显示突然有参数变化,且视频分析发现鱼群行为异常,而且养殖日志中报告了相似的历史事件,模型可以综合这些信息,准确预测可能的疾病或环境压力事件。此外,大模型可以推荐基于以往成功案例的处理措施,为管理者提供决策支持。
2.1.4防控策略优化与应对传统的养殖管理策略往往基于经验或有限数据,难以实现最优化的养殖效益[57]。基于大模型的分析结果,养殖者可以优化养殖环境、调整饲料配方和增强生物免疫力等,以降低疾病发生的风险。部分水产动物疾病难以预防和控制,如病毒性疾病的防治比较困难,一旦发生疫情往往会造成较大损失,加大了诊断工作的难度。大模型可以利用数据分析和预测技术,帮助养殖者预测动物的疾病风险和传播途径,制定有效的预防控制策略,减少疾病的发生和损失。
2.1.5应急响应机制建立病害暴发时,传统的应急响应机制往往无法及时有效地应对,导致经济损失严重。大模型具有处理海量数据的能力,可以全面分析水产动物健康数据、环境数据及历史病害数据。通过识别关键因素和模式,这些模型可以为病害的预警预报提供科学依据,如大模型可以分析不同因素对病害发生的影响程度,帮助养殖者制定更有效的预防措施。当大模型检测到数据异常时,可以立即触发预警系统,启动应急响应机制,减少疾病造成的损失。
综上,大模型在病害预测与早期预警中展现出超强的能力,通过深度分析养殖、环境和历史数据,其可准确识别病害风险,并提供及时预警。该技术提高了病害管理的效率和准确性,为水产养殖业的可持续发展提供了有力支持。
目前,致病微生物对水产动物的危害日益严重,而传统的诊断方法工作量大、耗时长,已不能满足水产养殖生产对水产动物疾病诊断的要求[58]。因此,建立水产动物疾病的快速诊断方法非常必要。此外,大模型在医学领域的成功,助推了其在水产动物疾病诊断中的可行性和应用前景。
2.2.2提高诊断准确性水产动物疾病的诊断需要综合考虑动物的体表、解剖结构和显微镜下的样本,以及环境变化、投饵施肥等多种因素。大模型可以结合图像识别、自然语言处理等技术,对病害图像和症状描述进行智能分析,辅助兽医或疾病诊断专家进行病害诊断和决策,以提高诊断的准确性。
2.2.3判断症状相似性水产动物患病后呈现的症状往往相似,容易造成诊断的混淆。大模型可以构建水产动物疾病的知识图谱和问答系统。用户可以通过输入问题或症状描述来获取可能的疾病原因、预防方法和治疗方案,帮助兽医或养殖者更好地区分和诊断不同疾病。
2.2.5增强病因推理病因推理在医学、公共卫生和疾病防控等多个领域中都扮演着重要角色。特别是在水产养殖中,疾病发生往往会对养殖业造成巨大的经济损失。通过病因推理,可以深入了解疾病的成因和传播途径,为疾病的预防和控制提供科学依据。大模型可以通过分析海量的病害数据和临床症状描述进行病因推理,帮助养殖者了解病害的成因和发展过程。这有助于养殖者更好地制定预防措施和治疗方案,降低病害的发生率和损失。
综上,大模型在水产生物病害诊断领域具有广泛的应用前景。大模型通过在辅助病原体识别、提高诊断准确性、判断症状相似性、优化给药策略及病因推理等方面的应用,能够显著提高水产动物疾病的诊断效率和准确性,为水产养殖业的可持续发展提供有力支持。未来,随着技术的不断发展和应用的深入,大模型将在水产动物疾病快速诊断领域发挥更加重要的作用。
水产养殖病害风险评估的研究有助于预防病害、降低损失、优化管理和提升效益,并助力政府制定防控策略,促进科研创新。这不仅保障了水产养殖业的健康发展,也保护了水域生态和食品安全。大模型的应用能够成为推动疾病风险评估和管理向更高精度和自动化水平发展的关键因素,未来可利用大模型处理复杂数据的能力,以及从已知数据中挖掘出深层次模式和规律的优势,为病害风险预测和评估提供科学准确的依据。
2.3.1缓解诊断材料获取困难的问题通常情况下,病害发生时活体鱼类难以从水中捞出,捞出的多是不新鲜或已腐败的鱼类,影响诊断的准确性。病害诊断需要用活体或刚死亡的养殖动物进行检查,但实际操作中往往难以获取此类样本。采用大模型和人工智能技术,可通过分析历史疾病数据、环境因素和动物群体数据等,进行病害风险评估和预测。这有助于在缺乏活体样本的情况下,提前识别潜在的疾病模式和趋势,从而采取预防措施。
2.3.2拓展防治措施范畴传染性疾病暴发迅速,给养殖生产造成很大损失,但预防措施往往未全面考虑一切能引起鱼病发生和传播的因素。预防工作既要注意消灭病因,切断传染与侵袭途径,又要提高鱼体的抗病力,采取综合性预防措施,但实际操作中往往难以全面实现。大模型可以帮助制定更全面的预防措施,通过分析大量的数据,包括环境因素、动物行为和病原体特征等,大模型可以识别出可能引起疾病暴发和传播的因素,并提出相应的综合性预防措施。
2.3.3解决评估数据不足难题病害风险评估需要大量的数据支持,包括历史疾病记录、环境因素和动物群体数据等。然而,在某些情况下这些数据可能不完整或不准确,从而影响评估的准确性和可靠性。利用大模型和人工智能技术,可以通过数据挖掘和机器学习方法,从有限的数据中提取更多的信息,并进行病害风险评估。这有助于克服数据不足带来的评估准确性和可靠性问题。
2.3.4应对复杂生态系统挑战水产动物生态系统通常非常复杂,包括多种动物种类和环境因素。因此,评估病害风险时需考虑这些复杂因素的相互作用,这可能增加了评估的复杂性和难度。利用人工智能技术建立复杂的生态系统模型,可以模拟不同因素对疾病传播的影响,从而提高病害风险评估的准确性[59]。这些模型可以考虑动物种类、环境因素和人为因素等多个方面的相互作用。
2.3.6克服技术水平和资源限制目前,一些地区由于缺乏先进的诊断技术和专业人员,可能限制了对病害风险的准确评估和有效管理。因此,技术水平和资源分配不均可能成为一个挑战。在技术水平和资源有限的地区,可以利用大模型和人工智能技术开发简化和易用的诊断工具及管理系统,以提高病害风险评估和管理的效率和可行性。
综上,各类大模型在水产养殖病害风险评估与管理中都具备独特的应用价值。应用时要根据具体任务和数据特性,选择合适的模型类型,并结合行业专家的知识和经验,以实现其在实际应用中的最大化效能。综合利用大模型和人工智能技术,可以有效应对水产养殖业中的各种挑战,提高疾病风险评估和管理的水平及效果。
在水产养殖业中,综合运用多模态大模型、语言模型、视觉大模型及科学计算大模型,为养殖环境的监测和优化提供了前所未有的可能性,这不仅能够显著提升生产效率,还大幅降低了疾病风险。
水产养殖环境复杂多变,受到水质、水温和养殖密度等因素的影响,这些环境因素可能会影响疾病的发生和传播,增加了诊断的复杂性[60-61]。大模型可以分析水质、水温等环境因素与疾病发生的关系,预测疾病的发生和传播趋势,为养殖者提供环境管理和疾病预防的建议。
传统的水质监测方法通常需要人工采样、实验室测试,而无法实现实时监测,导致对水质变化的反应不及时[62]。基于大模型的数据分析能力,可以建立实时监测系统,利用大规模数据预测和监测水质参数。这些模型可以利用历史数据和实时传感器数据,通过深度学习等方法,实现对水质参数的准确预测和实时监测,及时发现水质异常。
传统监测设备在养殖场覆盖广泛,但其布置通常受到采样点位的限制,可能无法全面覆盖养殖区域[63]。大模型可以利用语言模型处理和解析大量研究文献和养殖日志,提供基于证据的养殖环境调控建议,对监测数据进行智能分析,揭示趋势变化,发现水质异常并提前发出预警。这样的智能环境调控与预警系统可以帮助养殖者及时采取措施,避免水质问题对养殖环境造成不良影响。结合机器学习技术,如支持向量机或决策树,系统可以综合多种环境因素,优化光照、温度等关键参数,确保最适宜的养殖环境。
传统水质监测设备获取的数据量较大,如何对数据进行有效分析和利用可能是一个挑战。应用科学计算大模型与遗传算法、模拟退火等高级优化算法相结合,可设计出数据驱动的最优养殖模式。这包括精确的饲料投喂策略、养殖密度调整,并在保证生产最大化的同时维护水质稳定和动物健康。
传统水质监测设备通常只能监测部分水质参数,如溶解氧、氨氮等,无法全面反映养殖环境的综合状况[64-65]。采用视觉大模型配合深度强化学习,可以开发出能自我学习的监控系统,自动检测和调节养殖池中的多个参数。这种系统可即时响应环境变化,持续保障养殖环境处于理想状态。
传统水质监测设备的购买、维护和运行成本较高,对于一些小型养殖场来说可能承担不起。大模型技术为小型养殖场解决水质监测成本高昂的问题提供了新路径。借助先进的算法和数据分析能力,大模型可以实时处理和分析大量水质数据[66],以更低的成本提供精准的水质监测结果。这不仅减少了小型养殖场对传统设备的依赖,同时也优化了资源使用,降低了购买、维护和运行的总体费用,为小型养殖场实现经济高效的水质管理提供了可能。
目前,药物防控仍然是水产病害防控中最常用的手段之一。对于不同的病原类型应选择合适的药物进行预防和治疗,对症下药才能及时有效地遏制病害的发生和蔓延。随着各种化学合成药物(如抗生素等)的使用日益受到世界范围内多个国家的限制,天然、安全和高效防治剂的研发迫在眉睫[67-68]。大模型作为一种新兴的技术手段,其在数据处理、模式识别等方面展现出显著的优势,为水产动物疾病防治提供了新的思路。
水产药物机理不仅有助于深入理解药物在水产动物体内的作用方式,还能指导更精准的药物开发和应用,从而提高治疗效果,减少副作用,更有效地防控水产动物疾病,保障水产养殖业的健康发展。因此,可以尝试利用大模型在分子水平上模拟药物与病原体之间的相互作用,预测药物的作用机理和潜在效果。这有助于更准确地评估药物的疗效和安全性,为药物研发提供有力支持。
药物毒性评估是确保药物安全使用的关键,它能揭示药物潜在风险,指导药物剂量和治疗方案,保障水产动物健康及环境安全,是药物研发与水产养殖业健康发展的重要保障[69]。科学计算大模型能够详细分析药物与病原体间的相互作用,预测药物的活性和潜在副作用,为药物设计提供科学依据。大模型可用于预测药物对水产动物的潜在毒性,通过模拟药物在生物体内的代谢过程,评估药物对水产动物的安全性,并优化药物剂量和给药方式。
新药药效的预测和监控有助于提前评估新药的疗效和安全性,为养殖户提供科学的用药指导,减少药物滥用和误用,从而保障水产动物的健康生长,提高养殖效益,同时也减少了对水环境的潜在污染。与其他生物医学领域相同,相比于网络药理学、传统生物学等技术,大模型可以用于预测水产动物对药物的反应和治疗效果。通过实时监测疾病的发展情况和治疗效果,及时调整治疗方案,确保治疗的及时性和有效性。
综上,整合多源数据、模拟药物作用机理和预测药物毒性等手段,使大模型为水产动物疾病防治提供了新的视角和工具。未来,随着技术的不断发展和应用的逐步深入,大模型将在水产动物疾病防治领域发挥更加重要的作用。
利用机器学习算法,大模型能够识别和分类不同的表观遗传修饰,并理解它们如何影响基因表达。同时,图神经网络(GNN)等模型还能模拟和分析表观遗传标记之间的相互作用网络,为揭示疾病抗性机制提供新的视角。
深度学习模型能够处理和分析RNA或mRNA表达数据,揭示水产动物在环境变化或疾病状态下的基因表达模式。通过构建基因共表达网络,研究人员可以进一步理解基因间的相互作用关系,为疾病抗性培育提供新的策略。
在病毒检测方面,大模型能够从复杂的背景中识别出病毒颗粒或核酸序列的模式,辅助开发新的病毒富集和检测方法[72]。这不仅能提高病毒检测的效率和准确性,还能为抗病育种提供及时、准确的病毒监测手段。
综上,大模型在水产动物疾病抗性培育中的应用具有较强的可行性。育种本身就是大数据,其是通过大量数据之间的交叉验证,寻找最优的过程。组学技术的发展为获取大量、高质量的生物信息提供了可能,为大模型的应用提供了数据基础。大模型具有强大的数据处理和分析能力,能够从多个层面揭示水产动物的生理状态和疾病抗性机制。大模型的应用能够辅助研究人员发现新的抗病基因、优化育种策略和提高疾病抗性培育的效率。
大模型技术以其强大的数据处理和学习能力,为水产养殖病害防治提供了新的视角和工具。然而,在实际应用中,大模型技术的实施和发展面临着一系列挑战。
高质量数据是行业大模型的关键。采集和构建水产病害防治领域高质量数据对大模型在水产养殖病害防治中的应用起到决定性作用。然而,不同水体、种类的水产养殖动物对数据类型和数据量要求不同,且数据收集过程中易受环境干扰。因此,需从数据源管理、数据清洗、数据标准化处理和数据质量检测等多方面入手,确保每一份数据都具有完整性和准确性。此外,还可以结合ChatGPT等自然语言处理技术,开发智能数据清洗和标准化工具,通过自然语言指令或对话形式指导工具进行高效的数据处理,以提高数据质量和处理效率。
由于大模型强大的表征能力和高效的性能,使得其在执行诸多复杂任务时取得了较好的效果,但这并不意味着大模型适用于所有场景。在实际应用中,哪些业务场景适合使用大模型,每个业务场景应该选择何种大模型,基座模型是否开源等问题均需要根据实际需求进行有针对性的探讨。从基础研究角度看,基座模型和下一代大模型技术的自主可控是目前中国大模型研究的两大核心任务。由于水产养殖环境复杂多变,大模型还需具有良好的泛化能力,才能在不同环境和不同类型疾病中有效工作。
成本和效益的权衡是决定大模型广泛应用的关键因素。伴随着大模型参数和数据的提升,其对算力的要求也不断提高,这对水产养殖企业尤其是中小企业而言,可能是一个不小的负担。另外,对大模型进行微调训练也会产生巨大的开销。可以通过研究如何利用云计算和分布式计算平台,降低模型训练和部署的成本。通过研究大模型压缩和剪枝技术,优化模型结构和参数,提高模型的效率,减少计算资源需求。
尽管大模型可能在水产病害诊断和防治中表现出色,但其“黑箱”特性使得非专业人士难以理解其决策过程。因此,提高大模型的解释性对于增加养殖者和消费者的信任至关重要。可以利用模型解释技术,如可视化、因果推理等方法,开发可视化工具,提高模型的解释性和可理解性。此外,可通过加强用户教育和培训,增强他们对新技术的接受度和依赖性,以提高他们对大模型的信任。
在现实应用中,大模型可能需要同时处理多个任务,如疾病监测、环境评估和行为分析。如何有效管理这些任务并确定它们的优先级,以及如何训练模型以优化多任务学习,是实现高效应用的关键挑战。可以设计合适的多任务学习框架,优化模型性能;通过任务优先级和资源分配策略,确保关键任务得到优先处理,实现多任务间的有效管理和协同学习,提高模型的整体性能。
由于疾病暴发可能具有地域性,而有效的防治策略需要各地数据的整合分析。因此,建立一个高效的跨区域数据共享机制,并促进不同机构间的合作,是实现全面防控的重要因素。通过建立跨区域数据共享和合作机制,可促进各地数据的整合和共享,同时加强跨机构间的合作,制定统一的数据共享标准和协议,以实现疾病防控的全面性和协同性。
知识图谱作为结构化知识表示的有效方式,能够提供丰富的先验知识和关系,对大模型的性能提升至关重要。然而,构建与各类数据源相连通的知识图谱,并将其与大模型有效集成是一大挑战。这涉及到图谱的准确性、及时性,以及如何将图谱信息融入到模型的学习过程中。可以利用知识图谱中的结构化知识和关系,研究如何将知识图谱信息有效融入到大模型的学习过程中,优化模型的学习和推理过程,提高模型的性能和效果。
目前,随着技术瓶颈的逐步突破和自主创新能力的持续增强,大模型在水产养殖病害防治领域的应用研究将引领新一轮的行业技术变革和产业升级。以ChatGPT等人工智能模型在其他领域的应用发展来看,其在水产养殖病害防治领域必将具有强大的应用潜力。未来,大模型将更加注重实时性和动态性,并能实时监测和预测病害的发生趋势,为病害防治提供更为精准和有效的指导。同时,大模型将与其他先进技术如物联网、人工智能等深度融合,形成更为完善的水产病害防治体系。此外,随着跨学科研究的不断深入,大模型在水产病害防治领域的应用将不断拓展到新的领域或方面,为水产养殖业的可持续发展提供更加全面的支持。
参考文献:
[1]ADAMSA,THOMPSONKD.Developmentofdiagnosticsforaquaculture:challengesandopportunities[J].AquacultureResearch,2011,42:93-102.
[2]张红燕,袁永明,贺艳辉,等.水产养殖专家系统的设计与实现[J].中国农学通报,2011,27(1):436-440.ZHANGHY,YUANYM,HEYH,etal.Designandimplementationofexpertsystemforaquaculture[J].ChineseAgriculturalScienceBulletin,2011,27(1):436-440.(inChinese)
[3]熊中敏,马海宇,李帅,等.知识图谱在海洋领域的应用及前景分析综述[J].计算机工程与应用,2022,58(3):15-33.XIONGZM,MAHY,LIS,etal.Summaryofapplicationandprospectanalysisofknowledgegraphsinmarinefield[J].ComputerEngineeringandApplications,2022,58(3):15-33.(inChinese)
[4]刘巨升,杨惠宁,孙哲涛,等.面向知识图谱构建的水产动物疾病诊治命名实体识别[J].农业工程学报,2022,38(7):210-217.LIUJS,YANGHN,SUNZT,etal.Named-entityrecognitionforthediagnosisandtreatmentofaquaticanimaldiseasesusingknowledgegraphconstruction[J].TransactionsoftheChineseSocietyofAgriculturalEngineering,2022,38(7):210-217.(inChinese)
[5]沙明洋,张思佳,傅庆财,等.基于动态权重的多模型集成水产动物疾病防治事件抽取方法[J].华中农业大学学报,2023,42(3):80-87.SHAMY,ZHANGSJ,FUQC,etal.Multi-modelintegratedeventextractionforaquaticanimaldiseasepreventionandcontrolbasedondynamicweight[J].JournalofHuazhongAgriculturalUniversity,2023,42(3):80-87.(inChinese)
[8]孙柏林.大模型评述[J].计算机仿真,2024,41(1):1-7,24.SUNBL.Reviewoflargemodels[J].ComputerSimulation,2024,41(1):1-7,24.(inChinese)
[9]丁博,耿喆,朱江峰.基于GLM模型的印度洋延绳钓渔业大青鲨钩捕死亡率分析[J].上海海洋大学学报,2022,31(3):700-709.DINGB,GENGZ,ZHUJF.Evaluatingat-haulbackmortalityofblueshark(Prionaceglauca)intheIndianOceanlonglinefisherybasedonGLMmodel[J].JournalofShanghaiOceanUniversity,2022,31(3):700-709.(inChinese)
[11]RASMYL,XIANGY,XIEZQ,etal.Med-BERT:pretrainedcontextualizedembeddingsonlarge-scalestructuredelectronichealthrecordsfordiseaseprediction[J].NPJDigitalMedicine,2021,4(1):86.
[12]YANGF,WANGWC,WANGF,etal.scBERTasalarge-scalepretraineddeeplanguagemodelforcelltypeannotationofsingle-cellRNA-seqdata[J].NatureMachineIntelligence,2022,4:852-866.
[13]喻国明,金丽萍,卞中明.小有小的用处:大模型传播生态下的小模型:概念定义、技术构造与价值角色[J].新闻记者,2024(1):3-17,58.YUGM,JINLP,BIANZM.Smallhassmalluse:smallmodelundertheecologyoflargemodelcommunication-conceptdefinition,technicalstructureandvaluerole[J].ShanghaiJournalismReview,2024(1):3-17,58.(inChinese)
[14]车万翔,窦志成,冯岩松,等.大模型时代的自然语言处理:挑战、机遇与发展[J].中国科学:信息科学,2023,53(9):1645-1687.CHEWX,DOUZC,FENGYS,etal.Towardsacomprehensiveunderstandingoftheimpactoflargelanguagemodelsonnaturallanguageprocessing:challenges,opportunitiesandfuturedirections[J].ScientiaSinica(Informationis),2023,53(9):1645-1687.(inChinese)
[16]张乾君.AI大模型发展综述[J].通信技术,2023,56(3):255-262.ZHANGQJ.SurveyonthedevelopmentofAIlargemodel[J].CommunicationsTechnology,2023,56(3):255-262.(inChinese)
[20]RADFORDA,WUJ,CHILDR,etal.Languagemodelsareunsupervisedmultitasklearnerss[J].OpenAIBlog,2019,1(8):9.
[27]BIK,XIEL,ZHANGH,etal.Accuratemedium-rangeglobalweatherforecastingwith3Dneuralnetworks[J].Nature,2023,619:533-538.
[28]WANGY,HUM,TAN,etal.Largelanguagemodelsandtheirapplicationingovernmentaffairs[J].JournalofTsinghuaUniversity(ScienceandTechnology),2024,64(4):649-658.
[31]董添.科大讯飞星火认知大模型V3.5发布[N].中国证券报,2024-01-31(A06).DOI:10.28162/n.cnki.nczjb.2024.000503.DONGT.IFLYTEKsparkcognitivelargemodelV3.5launched[N].ChinaSecuritiesJournal,2024-01-31(A06).DOI:10.28162/n.cnki.nczjb.2024.000503.(inChinese)
[34]袁静娴.腾讯混元大模型正式亮相[N].深圳商报,2023-09-08(A03).DOI:10.28774/n.cnki.nszsb.YUANJX.TencentHunYuanbigmodelofficiallyunveiled[N].ShenzhenBusinessDaily,2023-09-08(A03).DOI:10.28774/n.cnki.nszsb.(inChinese)
[35]潘婷.腾讯云副总裁胡利明:大模型在金融领域,正分场景落地[N].每日经济新闻,2023-09-12(005).DOI:10.28571/n.cnki.nmrjj.2023.003281.PANT.HuLiming,vicepresidentofTencentCloud:thebigmodelinthefinancialfieldislandingindifferentscenes[N].NationalBusinessDaily,2023-09-12(005).DOI:10.28571/n.cnki.nmrjj.2023.003281.(inChinese)
[41]LIYN,MASR,WANGXB,etal.EcomGPT:instruction-tuninglargelanguagemodelswithchain-of-tasktasksforE-commerce[J].ProceedingsoftheAAAIConferenceonArtificialIntelligence,2024,38(17):18582-18590.
[42]HEKM,ZHANGXY,RENSQ,etal.Deepresiduallearningforimagerecognition[C]//2016IEEEConferenceonComputerVisionandPatternRecognition(CVPR).LasVegas,NV,USA:IEEE,2016:770-778.
[45]官璐,何康,斗维红.微调大模型:个性化人机信息交互模式分析[J].新闻界,2023(11):44-51,76.GUANL,HEK,DOUWH.Fine-tuninglargelanguagemodels:theanalysisofpersonalizedhumancomputerinformationinteractionpatterns[J].JournalismandMassCommunication,2023(11):44-51,76.(inChinese)
[48]基于网内计算的加速AI大模型分布式训练方法及装置:CN202311119840.5[P].CN117371516A.DistributedtrainingmethodanddeviceforacceleratedAIlargemodelbasedonin-networkcomputing:CN202311119840.5[P].CN117371516A.(inChinese)
[50]刘学博,张民,龚声蓉.大模型智能与安全研究综述[J].常熟理工学院学报,2024,38(2):1-6,11.LIUXB,ZHANGM,GONGSR.Acomprehensivereviewoflargelanguagemodelsandsecurityintelligenceanalysis[J].JournalofChangshuInstituteofTechnology,2024,38(2):1-6,11.(inChinese)
[51]陈润生.医疗大数据结合大语言模型的应用展望[J].四川大学学报(医学版),2023,54(5):855-856.CHENRS.Prospectsfortheapplicationofhealthcarebigdatacombinedwithlargelanguagemodels[J].JournalofSichuanUniversity(MedicalSciencesEdition),2023,54(5):855-856.(inChinese)
[53]宋林生.海水养殖贝类病害预警预报技术及其应用[J].大连海洋大学学报,2020,35(1):1-9.SONGLS.Anearlywarningsystemfordiseasesduringmolluscmariculture:explorationandutilization[J].JournalofDalianOceanUniversity,2020,35(1):1-9.(inChinese)
[54]HANP,LUQ,FANL,etal.Areviewontheuseofmicroalgaeforsustainableaquaculture[J].AppliedSciences,2019,9(11):2377.
[55]何佳,黄志涛,宋协法,等.基于计算机视觉技术的水产养殖中鱼类行为识别与量化研究进展[J].渔业现代化,2019,46(3):7-14.HEJ,HUANGZT,SONGXF,etal.Researchprogressonrecognitionandquantificationoffishbehaviorinaquaculturebasedoncomputervisiontechnology[J].FisheryModernization,2019,46(3):7-14.(inChinese)
[56]张丰硕,李豫,李向前,等.一种消减多模态偏见的鲁棒视觉问答方法[J].北京大学学报(自然科学版),2024,60(1):23-33.ZHANGFS,LIY,LIXQ,etal.Reducingmulti-modelbiasesforrobustvisualquestionanswering[J].ActaScientiarumNaturaliumUniversitatisPekinensis(NatureScienceEdition),2024,60(1):23-33.(inChinese)
[57]王智强.人工智能大模型在智慧农业领域的应用[J].农业工程技术,2024,44(8):17-18.WANGZQ.Theapplicationofartificialintelligencebigmodelsinthefieldofsmartagriculture[J].AgriculturalEngineeringTechnology,2024,44(8):17-18.(inChinese)
[58]徐民俊,徐泽蕙,李长忠.虹鳟常见重要病害及“四级八标”系统化诊断方法[J].水生生物学报,2024,48(4):707-712.XUMJ,XUZH,LICZ.Commoneconomicaldiseasesofrainbowtroutandthesystematicdiagnosismethodnamed“fourlevelsandeightindicators”[J].ActaHydrobiologicaSinica,2024,48(4):707-712.(inChinese)
[59]李道亮,刘畅.人工智能在水产养殖中研究应用分析与未来展望[J].智慧农业(中英文),2020,2(3):1-20.LIDL,LIUC.Recentadvancesandfutureoutlookforartificialintelligenceinaquaculture[J].SmartAgriculture,2020,2(3):1-20.(inChinese)
[60]PéREZ-SNCHEZT,MORA-SNCHEZB,BALCZARJL.Biologicalapproachesfordiseasecontrolinaquaculture:advantages,limitationsandchallenges[J].TrendsinMicrobiology,2018,26(11):896-903.
[62]孙龙清,王泊宁,王嘉煜,等.基于G-RepVGG和鱼类运动行为的水质监测方法[J].农业机械学报,2022,53(sup2):210-218.SUNLQ,WANGBN,WANGJY,etal.WaterqualitymonitoringmethodbasedonG-RepVGGandfishmovementbehavior[J].TransactionsoftheChineseSocietyforAgriculturalMachinery,2022,53(sup2):210-218.(inChinese)
[63]海涛,陈娟,韦文,等.物联网技术在养殖塘水质监控系统中的应用[J].河南科技大学学报(自然科学版),2021,42(2):53-58.HAIT,CHENJ,WEIW,etal.Applicationofinternetofthingstechnologytowaterqualitymonitoringsystemofaquaculturepond[J].JournalofHenanUniversityofScienceandTechnology(NaturalScienceEdition),2021,42(2):53-58.(inChinese)
[64]洪永强,谢永和,刘鲁强,等.基于ESSA-LSTM的养殖工船水质溶解氧预测方法研究[J].南方水产科学,2024,20(1):62-73.HONGYQ,XIEYH,LIULQ,etal.ResearchonwaterqualitydissolvedoxygenpredictionmethodbasedonESSA-LSTMforaquacultureships[J].SouthChinaFisheriesScience,2024,20(1):62-73.(inChinese)
[66]刘明剑,刘丽丽,朱宏升,张思佳.海水养殖水质监测与分析系统设计与实现[J].水产学杂志,2023,36(4):99-108.LIUMJ,LIULL,ZHUHS,etal.Designandimplementationofawaterqualitymonitoringandanalysissystemformaricultureenvironment[J].ChineseJournalofFisheries,2023,36(4):99-108.(inChinese)
[67]胡洋,张旭,王欢,等.药用植物资源在水产动物疾病控制中的研究进展[J].中国生物工程杂志,2022,42(11):43-58.HUY,ZHANGX,WANGH,etal.Researchprogressofmedicinalplantresourcesinaquaticanimaldiseasescontrol[J].ChinaBiotechnology,2022,42(11):43-58.(inChinese)
[68]吕可,赵前程,刘婧懿,等.噬菌体在水生动物病害防治中的应用问题和解决策略[J].水产科学,2020,39(6):964-971.LüK,ZHAOQC,LIUJY,etal.Applicationofbacteriophageinaquaculture:focusingonproblemsandsolutions[J].FisheriesScience,2020,39(6):964-971.(inChinese)
[69]陈如荔,张瑾,周娜娜,等.抗生素与消毒剂对青海弧菌Q67的联合毒性评估[J].环境科学与技术,2022,45(10):1-10.CHENRL,ZHANGJ,ZHOUNN,etal.EvaluationonthecombinedtoxicityinteractionbetweenantibioticsanddisinfectanttowardsVibrioqinghaiensissp.-Q67[J].EnvironmentalScience&Technology,2022,45(10):1-10.(inChinese)
[70]程郁,叶兴庆,宁夏,等.中国实现种业科技自立自强面临的主要“卡点”与政策思路[J].中国农村经济,2022(8):35-51.CHENGY,YEXQ,NINGX,etal.Themain“stumblingblocks”andpolicysuggestionsforChina’sseedindustrytoachieveself-relianceandself-improvementinscienceandtechnology[J].ChineseRuralEconomy,2022(8):35-51.(inChinese)
[71]STEYAERTS,PIZURICAM,NAGARAJD,etal.Multimodaldatafusionforcancerbiomarkerdiscoverywithdeeplearning[J].NatureMachineIntelligence,2023,5:351-362.
ZHANGSijia1,2,3,YUHong1,2,3*
(1.LiaoningProvincialKeyLaboratoryofMarineInformationTechnology,CollegeofInformationEngineering,DalianOceanUniversity,Dalian116023,China;2.KeyLaboratoryofEnvironmentControlledAquaculture(DalianOceanUniversity),MinistryofEducation,Dalian116023,China;3.DalianKeyLaboratoryofSmartFisheries,Dalian116023,China)
Keywords:largemodel;aquaculture;diseasepreventionandcontrol;intelligence;deeplearning
中图分类号:S943
文献标志码:A
DOI:10.16535/j.cnki.dlhyxb.2024-120
收稿日期:2024-05-29
基金项目:辽宁省重点研发计划项目(2023JH26/10200015);辽宁省教育厅高等学校基本科研项目面上项目(LJKMZ20221095)
作者简介:张思佳(1982—),女,博士,副教授。E-mail:zhangsijia@dlou.edu.cn
通信作者:于红(1968—),女,博士,教授。E-mail:yuhong@dlou.edu.cn