少年帮|利用深度学习生成医疗报告( 八 )
但请记住 , 随着束宽度的增加 , 时间复杂度也会增加 。 因此 , 这些比贪婪搜索慢得多 。
def beamsearch(image, beam_width):start = [tokenizer.word_index['startseq']]sequences = [[start, 0]]img_features = Xnet_Features[image]img_features = encoder_model.predict(img_features)finished_seq = []for i in range(max_rep_length):all_candidates = []new_seq = []for s in sequences:text_input = pad_sequences([s[0]], 155, padding='post')predictions = decoder_model.predict([img_features, text_input])top_words = np.argsort(predictions[0])[-beam_width:]seq, score = sfor t in top_words:candidates = [seq + [t], score - log(predictions[0][t])]all_candidates.append(candidates)sequences = sorted(all_candidates, key = lambda l: l[1])[:beam_width]# 检查波束中每个序列中的'endseq'count = 0for seq,score in sequences:if seq[len(seq)-1] == tokenizer.word_index['endseq']:score = score/len(seq)# 标准化finished_seq.append([seq, score])count+=1else:new_seq.append([seq, score])beam_width -= countsequences = new_seq# 如果所有序列在155个时间步之前结束if not sequences:breakelse:continuesequences = finished_seq[-1]rep = sequences[0]score = sequences[1]temp = []rep.pop(0)for word in rep:if word != tokenizer.word_index['endseq']:temp.append(tokenizer.index_word[word])else:breakrep = ' '.join(e for e in temp)return rep, score
束搜索并不总是能保证更好的结果 , 但在大多数情况下 , 它会给你一个更好的结果 。
你可以使用上面给出的函数检查束搜索的BLEU分数 。 但请记住 , 评估它们需要一段时间(几个小时) 。
8.5 示例现在让我们看看胸部X光片的预测报告:
图像对1的原始报告:“心脏正常大小 。 纵隔不明显 。 肺部很干净 。 ”
图像对1的预测报告:“心脏正常大小 。 纵隔不明显 。 肺部很干净 。 ”
对于这个例子 , 模型预测的是完全相同的报告 。
图像对2的原始报告:“心脏大小和肺血管在正常范围内 。 未发现局灶性浸润性气胸胸腔积液
图像对2的预测报告:“心脏大小和肺血管在正常范围内出现 。 肺为游离灶性空域病变 。 未见胸腔积液气胸
虽然不完全相同 , 但预测结果与最初的报告几乎相似 。
图像对3的原始报告:“肺过度膨胀但清晰 。 无局灶性浸润性渗出 。 心脏和纵隔轮廓在正常范围内 。 发现有钙化的纵隔
图像对3的预测报告:“心脏大小正常 。 纵隔轮廓在正常范围内 。 肺部没有任何病灶浸润 。 没有结节肿块 。 无明显气胸 。 无可见胸膜液 。 这是非常正常的 。 横膈膜下没有可见的游离腹腔内空气 。 ”
你没想到这个模型能完美地工作 , 是吗?没有一个模型是完美的 , 这个也不是完美的 。 尽管存在从图像对3正确识别的一些细节 , 但是产生的许多额外细节可能是正确的 , 也可能是不正确的 。
我们创建的模型并不是一个完美的模型 , 但它确实为我们的图像生成了体面的报告 。
现在让我们来看看一个高级模型 , 看看它是否提高了当前的性能!!
推荐阅读
- 金戈鐵馬|特朗普力挺铁杆支持者,枪杀两人的少年没错?抗议活动不断发酵
- 开封于七一|育迎宾尚法好少年,借温柔秋风多送法
- 少年|央视要搞选秀,热搜沸了!网友提名他当导师,点赞数第一
- 暖夏少年|2020电脑硬盘销量排行榜:七彩虹加入战局,硬是打倒了金士顿
- 少年一梦|2020畅销手机排行,iPhone无人超越,安卓旗舰全线溃败
- 少年帮|进入倒计时,华为突然宣布,供应链将迎来“洗牌”?
- 深度|创意信息:与成都市大数据股份有限公司签署深度合作协议
- |西装、奶奶针织衫显老气?深度解析“衣橱单品”,多看一眼就赚了
- 少年帮|纯国产“龙芯”即将来临,正式确认?中科院宣布决定
- 上线|原创央视也搞成团选秀!《上线吧!华彩少年》有哪些优势?粉丝放心了