SenseNova-SI是商汤科技发布的开源空间智能大模型,专注于提升AI在空间理解与推理方面的能力。模型在空间测量、重构、关系判断、视角转换、形变分析和空间推理等六个核心维度上表现出色,显著优于其他开源和闭源模型。例如,在复杂道路场景中,SenseNova-SI能精准判断车辆的后续动作,而其他模型则难以做到。SenseNova-SI采用系统化的训练方法,通过大规模高质量数据训练,验证了“尺度效应”,显著提升空间认知能力。基于多模态基础模型构建,通过持续训练,使模型在复杂场景中具备更强的空间理解能力。
>>展开阅读
Frappe Builder是开源的低代码建站工具,由Frappe公司开发,核心特点是提供类似Figma的可视化编辑器,支持拖拽组件快速搭建网站。属于Frappe生态(Frappeverse)的一部分,相比传统AI建站工具,Frappe Builder的优势在于操作直观可控,用户可以直接通过界面调整样式和布局,无需编程基础。开源特性允许自由扩展,适合个人展示或小型企业快速部署网站。
>>展开阅读
Omnilingual ASR是Meta推出的多语言语音识别框架,覆盖1600+语言,78%语言字符错误率低于10%。其70亿参数wav2vec 2.0编码器结合CTC与Transformer解码器,支持零样本转录未见语言,仅需少量示例即可适配新语种。模型开源,含350种低资源语言语料库,推动全球濒危语言数字化与语音技术普惠。
>>展开阅读
最近看一个聊天室源码界面很好看,聊天也很流畅,支持发送图片语音文件等,还可以以游客身份登录参与,很强大的一款应用。于是我就想自己也搭建一个玩玩。 去网上找了一圈,基本确定是ChatNet程序。不过网上找到的这个程序,几乎都是英文版本的,没有完整汉化,要么版本就比较老。我今天要分享的这个是V1.11经典版到V1.9 的chatnet程序包,而且已经完全汉化了。应该是花钱买的翻译版本,总共接近1000多个英文字段,反复校对,根据场景做了详细调整,追求精准无误。
>>展开阅读
您可以验证存取伺服器的网路检索器是否确实为Google 检索器(例如Googlebot)。如果担心垃圾邮件制造者或其他恶意份子假冒Googlebot 存取您的网站,这是相当实用的解决方法。
>>展开阅读
我能够共享NTFS驱动器上的文件夹中的内容,在Ubuntu中将用户minidlna添加到plugdev组中。
>>展开阅读
御剑是一款目录探测工具,同样可以用于扫描备份文件,操作很简单,打开软件输入网址扫描即可,配置都是默认配置了的。如果有必要可以自行修改配置更改字典。字典选择的话下面打勾的那几个就是字典,你也可以别同时扫描怎么多。
>>展开阅读
DeepOCR 是开源复刻项目,实现 DeepSeek-OCR 的核心架构,通过光学压缩技术高效处理文本信息。核心是 DeepEncoder,由 SAM-base(处理高分辨率图像)、16×卷积压缩器(减少 token 数量)和 CLIP-large(处理压缩后的特征)组成。这种设计在保持高分辨率处理能力的同时,显著降低了激活内存和 token 数量。DeepOCR 采用两阶段训练流程:第一阶段使用 LLaVA-CC3M 数据集进行视觉 - 语言对齐训练;第二阶段使用 olmOCR 数据集进行 OCR 特定预训练。通过这种训练方法,DeepOCR 在 OmniDocBench 和 olmOCR 基准测试中表现出色,尤其在英文文本识别和表格解析任务中,验证了光学压缩的有效性。
>>展开阅读
- «
- 1
- 2
- 3
- 4
- 5
- 6
- ...
- 115
- »