古籍酷 GJ.cool
登录
Login
重要更新:
1、PDF。生成算法更新,支持生僻字复制。
2、批量处理。优化文件加载速度。
1、OCR API. 增加avif格式支持。
1、批量处理。增加PDF上传功能,可设置dpi参数,将按照指定dpi转为图片,然后即可进行后续操作。PDF体积不应超过500MB。批量处理图片仅保存最近的至多2000张。
2、对齐。修复已知问题。
1、标注平台。导出格式升级,增加单字坐标、识别概率、候选项,并包括自动生成结果层次和含夹注格式的分行文本的字段。
2、标注平台。列坐标绘制,实现自动排序,在绝大部分场景可以取代人工排序。通过勾选“自动排序”开启。
3、标注平台。支持保留更多数量的文件。加载文件时可以同时加载图像和数据。
4、图文对照。增加字框的绘制、删除、显示等功能,实现编辑后的字框与文字自动对齐。绘制字框时会根据图文对齐情况自动选择增加新的文字或为原文字补充字框信息(实验性功能)。
5、批量处理。全新界面和功能。实现上传与识别相分离,更友好的上传进度提示。文件上传后除非自行删除,可以长期保留,以进行后续的OCR识别、PDF生成、多种数据格式导出、图像格式转换等操作。支持字序(OCR原始格式)和列序(编辑后)两种格式导出,从字序向列序转换时可以保留完整的字段信息。
一般更新:
1、从本地加载数据时,仅支持json格式,不再支持txt、csv。导出数据时,json格式始终导出完整内容;导出txt、csv时可以导出文本,并选择是否导出坐标,不支持导出其他内容。
已知问题:
1、图文对照。通过添加多个连续相邻字框以增加新文字时需要按照从下至上的顺序。
2、含夹注的分行文本字段依赖自动排序,人工排序会导致无法准确生成对应的分行文本。
3、相关使用说明尚未更新。
1、API演示。优化jp2文件加载,增加下载进度提示。
1、首页快速体验。增加上传进度提示。
2、API演示。增加演示账号的当前用量的实时反馈。
1、双层PDF API参数调整。compression取值范围调整为0-5的整数,数值越大则图像压缩程度越大,生成的PDF文件体积越小。
2、标注平台。优化图片上传按钮,新增文件信息展示。批量处理界面的图片上传、数据上传分为两个独立按钮,增加当前使用量的实时反馈。
1、导航栏调整。
1、自动标点、文白翻译。非授权用户使用额度每天恢复1万字,累计上限7万字。授权用户可以直接在网页端使用额度。更新网页端界面。
1、ocr_login API。增加is_long字段,用于生成长效token。过期时间为90天。
1、标注平台,图文对照。优化右键菜单的间距。
1、orc_pro API。(1)输出结果增加ContentType, Size, Layout, Area, Compact, layer, option, text等字段。见文档说明。(2)图片体积上限从40MB调整至70MB。
2、自动标点API。(1)服务移至api.jzd.cool,授权用户可通过账户页面查询调用地址。其中账号页面显示的使用总量 = 购买总量 - gj.cool上的已使用量,已使用量从0计算。(2)字数上限从5000字提升至20000字。
3、ocr_login API。access_token的过期时间从60分钟调整为24小时。解决网页批量用户超过一定时间后数据和pdf无法下载的问题。
4、写作功能下线。
1、标注平台。修改四边形坐标顶点的时候,实现顶部/底部的自动找平,显著提高坐标修改效率。
1、标注平台。上传图片时采用新的进度提示框,用于屏蔽上传未完成时用户的菜单操作。
2、标注平台。修复四边形坐标绘制完成时的顶点排序问题。
1、OCR API。支持图像格式新增JPEG 2000(image/jp2)。
2、标注平台。图文对照,异体字替换后继续保持坐标的显示状态。
1、标注平台。坐标排序、合并、删除、修改顶点、横向切分、纵向切分后继续保持显示状态。
2、标注平台。图文对照,优化右键菜单的显示。优化易错字的选项数量。
1、文白翻译单次支持1000字,每日每IP有一定使用次数限制。
1、调整API文档。
1、首页增加“快速体验”。
1、登录、注册页面增加验证码。
1、优化网页授权用户的上传网速。
2、削减API授权用户赠送的算力值。网页授权用户不再赠送算力值。
1、新注册用户的算力值上限临时性减半,直至完善用户认证方式后恢复。
1、调整统计、登录、注册等页面的布局。
1、OCR标注平台,增加自动识别图像特效。
2、优化首页布局,调整文字。
1、公益项目版块,增加“数字万舟”。
1、首页。增加公益项目受理的相关说明。
2、标注平台。设置上传图片的算力值消耗为30,同时将URL上传的算力值消耗从20提升至30。
1、API演示。增加SR超分辨率、双层PDF API 演示。
1、API快速演示。增加webp、heic\heif格式支持。新增图像格式转换功能,可以另存为png、jpeg、webp等格式。
1、API快速演示。增加图像缩放、多张图片支持。
1、增加API使用演示。
2、写作。以打字机效果显示输出结果。
1、导航改版,栏目重新归类。
2、标注平台。继续修复坐标显示问题,为改版做准备。
1、标注平台。修复坐标显示问题。
1、标注平台。优化命令栏分组和显示效果。表格与图像中的文本区域增加右键功能,可以进行异体字等的查询或替换。绘制结束时反馈绘制结果。
1、标注平台。增加单字图像显示。
1、检测API演示。修复表格的搜索功能。
1、标注平台。增加结构层次,包括字、列。优化双层pdf。
1、标注平台。修复双层pdf的问题。限制进行超分辨率的图片长宽不得超过2500像素。
2、校对。限制文本长度不得超过2000字。
1、更新首页。增加生态。对非注册用户开放标点、校对、对齐和接口说明。
2、接口。增加Windows系统调用API的提示。
1、更新首页,导航。对非注册用户开放标点、校对、对齐和接口说明。
2、标注平台。Pro,新增超分辨率。
1、标注平台。修复自动识别(横版)的问题。
1、标注平台。图文对照:优化断句提示的显示效果,新增句内停顿提示。
1、标注平台。图文对照:新增断句提示。
1、校对。增加标点转移的提示。
1、账户。增加授权及其使用情况显示。
1、标注平台。图文对照:调整保存提示。相同字计数中增加编辑个数。
1、标注平台。图文对照:新增相同字计数及其提示。调整异体字修改提示的布局。
1、文白翻译Beta版。
1、写作Beta版。使用文本生成模型,在预设条件下自动生成文本。
一般更新
1、404错误重定向至首页。
1、更新首页。新增自动标点。
2、标注平台。批量处理:修复算力值计数异常问题。
1、标注平台。图文对照:新增在线资源;新增编辑菜单调用失败提示。
1、标注平台。优化IO。优化单列表格中的候选字,调整为“基于历史上传图片自动生成”。
1、标注平台。图文对照:调整上下文菜单;新增异体字替换当前状态提示;优化替换结果的信息显示;修复部分显示问题。
1、标注平台。图文对照:调整形近字选项个数;调整部分功能的默认值。修复算力值计数问题。
1、标注平台。图文对照:新增形近字。
1、标注平台。内置形近字、字频统计功能,用于提升用户体验。
1、标注平台。倾斜优化,新增对自动识别的支持。合并自动识别与智能校正功能及其算力值消耗。优化按钮显示。
1、标注平台。图文对照,优化右键菜单样式,修复菜单项的不正常隐藏。
1、标注平台。加载数据,优化倾斜校正算法。图文对照,优化右键菜单位置。
1、标注平台。批量处理,改为仅向授权用户开放。
1、标注平台。图文对照,增加自定义异体字。
1、标注平台。图文对照,增加全局替换、向后替换,仅对异体字生效。
1、标注平台。图文对照,增加向前补字、向后补字,增加拼音、Unicode Block提示。
1、标注平台。图文对照,增加语义替换。
1、标注平台。图文对照,增加异体字、易错字等辅助功能。
1、标注平台。从本地端加载“文本+坐标”,针对字标注格式的数据文件,增加“倾斜优化”选项,用包络四边形显示列坐标。
1、学术版OCR。修复少数情况下自动识别失败的问题。
1、学术版OCR。更新文档。
1、学术版OCR。调整限流周期为24小时。简化参数和返回格式。
1、工业版OCR。为正式授权用户赠送算力值。
2、标注平台。优化错误提示。
1、标注平台。优化网络响应。
1、API。优化计算速度。
1、API。OCR工业版API,新增列识别、增强型检测、动态计数余额查询。
1、API。OCR工业版API,新增area参数,根据图像的多个指定区域进行识别。新增请求最小时间间隔。
1、API。ocr_login:新增encrypt参数。
1、API。OCR工业版API发布,开放正式授权用户申请。
1、OCR。标注平台。新增候选字功能,基于个人数据自动生成。
2、API。识别、检测API的返回格式,增加了关于错误信息和限流策略的说明。
1、OCR。标注平台。优化图像中的文本区域显示和编辑问题。
1、OCR。界面调整,新增批量处理。
2、OCR。标注平台。新增横版自动识别,新增文字方向设置。
3、网站声明。新增第五条:“有意利用本网站提供的工具从事盈利性活动者,应向北京籍智达数字科技有限公司取得商用授权,以确保使用过程的稳定性和必要的技术支持。”
1、OCR。标注平台。调整图像放大缩小的步进倍数,为表格增加坐标关闭功能,调整导出文件的命名方式,加载数据菜单增加从服务端加载自动备份功能,导出数据菜单增加同步至批量列表功能。
2、关于。调整OCR工业版的文字说明,新增网页体验。
1、OCR。列识别。新增双层PDF导出功能。
1、OCR。列识别。新增声音反馈。
2、统计。调整统计口径。
1、OCR。列识别。新增网址上传、自动识别、智能校正等专业功能。
2、新增算力配额。在识别页面和账户页面显示当前算力及其配额。
1、OCR。列识别。缩小图像、放大图像的图标优化。修复网址上传、自动识别、智能校正的问题。新增算力值恢复时间提示。
1、OCR。列识别。改进对tiff格式的支持。修复合并坐标的问题。
1、OCR。列识别。新增坐标的顶点修改,调整菜单。
1、OCR。列识别。新增坐标操作:排序、合并、切分。显示选项新增序号。更新使用提示。
1. OCR。列识别:新增改变坐标形状。
1. OCR。列识别:新增文本视图;新增处理环境设置,支持离线编辑标注数据。
1. OCR。列识别:进行合并或删除时,新增弹窗确认。对功能菜单进行重新布局,更新图标。根据最新功能重新编写使用提示。
2. OCR。字识别:修复问题。
1. OCR。列识别:新增降低至末位;新增加载文本。
1. OCR。列识别:新增提升至首位。
1.OCR。列识别:调整标注结果的顺序;合并相邻标注。
2.OCR。列识别:图文对照,新增布局间距。
1. OCR。列识别:改进坐标形状、布局方式的选项提示;选择性显示坐标或文本;选择性导出文本或坐标。
1. OCR。列识别:修复四边形坐标的绘制和图文对照问题。
1. OCR。列识别:修复实时编辑的Bugs。
1. OCR。列识别:新增识别概率的颜色表示。
1. OCR。列识别:导出格式、导入格式增加json。
1. OCR。列识别:图文对照新增固定布局、流式布局、放大、缩小、实时编辑等功能。
1. OCR。列识别:新增图像收缩与展开,图文对照增加序号,调整表格选择方式为多选。
1. OCR。列识别:图文对照,下载标注文件。检测:改善图像处理方式。
1. OCR。增加四边形的标注形状,标注文字编辑,清除选区,加载标注文件。
1. OCR。单列识别:增加坐标数据项。
2. 隐私政策调整,增加了将酌情记录“持续长时间API请求所提交的图片或文本”的规定。
1. OCR。加大图片展示宽度。
2. Stats。增加统计时间长度至30日。
3. 调整全站页面布局。
1. API。规范响应格式,增加状态码;对频繁请求累计等待时间。
1. API。增加针对IP的流量限制。
1. Align。精确模式下,文本长度限制在1000字以内;快速模式下,文本长度限制在3000字以内。
2. 登录时提示最新一次的更新内容。
1. 调整主要功能按钮布局。
2. Compare: 修改Bug。
1. Align: 新增对齐功能。
1. 修改错误提示方式。
1. Compare: 调整界面文字描述。
1. Compare: 新增比对功能。
1. Stat: 新增图表类型与统计指标。
1. Privacy: 新增隐私政策、用户义务、网站声明。
2. About: 新增自动标点介绍。
3. Stat: 新增最近7日OCR使用统计。
1. 补充“致谢”。
1. Ocr: 检测后识别,搜索时自动显示原图位置。
1. Ocr: 检测后识别,增加字图对应。
1. Ocr: 单列识别,表格增加全屏模式。
2. Ocr: 增加自定义项:检测字图尺寸。
1. Ocr: 上传图片默认采取前端压缩策略。压缩后的尺寸上限是1200px。
2. Ocr: 支持tiff格式。
3. Ocr: 删除全部文本之前,增加对话框加以确认。
1. Ocr: 更新使用提示。
1. Ocr: 选择识别区域时,实时显示识别结果。
2. API: 增加自动标点API文档。
1. Ocr: 解决大图片无法显示的问题,提升上传图片的体积上限。详情见“使用提示”。
2. Ocr: 选择识别区域时鼠标可以向各个方向自由移动,并提供光标形状反馈,解决了以前只能从左上向右下移动的问题。
3. Ocr: 拖动并释放识别区域后,可以通过双击识别区域向表格添加识别结果。
4. Ocr: 调整上传时的等待反馈。
1. Punct: top1提示阈值,清除标点,post调用接口。
1. Punct: 增加是否包含概率的选项。实现统计、复制、清除、切换概率显示方式等功能。
1. 新增Punct。实现基本的自动标点功能。
1. Ocr单列:(1)文本可编辑。(2)图文同步。
2. Ocr单字、单列:(1)新增仪表盘,提供15个自定义选项。(2)修复坐标移动时发生宽度异常的问题。
3. 补充“致谢”。
4. 新增Changelog。
1. About, Author: 添加目录。
2. Ocr检测后识别:修复图片大小不正常的问题。